我們來(lái)分析一下。假定一次比賽有9個(gè)評(píng)委,9個(gè)評(píng)委給每個(gè)參賽選手所打分?jǐn)?shù),表現(xiàn)為一組數(shù)據(jù)。現(xiàn)在,我們就用9個(gè)評(píng)委給每個(gè)參賽選手所打分?jǐn)?shù)的平均值作為這組數(shù)據(jù)的代表,來(lái)評(píng)價(jià)選手的成績(jī)。這樣做有時(shí)會(huì)出現(xiàn)什么問(wèn)題呢?
如果9個(gè)評(píng)委給甲選手的打分是:89,78,79,77,76,75,81,79,74
計(jì)算得平均分為:78.67;
給乙選手的打分是:90,80,81,79,78,76,84,82,50
計(jì)算得平均分為77.78。
從平均分?jǐn)?shù)上看,甲選手得分高于乙選手。
進(jìn)一步分析這兩個(gè)選手的得分會(huì)發(fā)現(xiàn),除評(píng)委9為甲打的分?jǐn)?shù)高于乙以外,其余評(píng)委為甲打的分?jǐn)?shù)都比乙低,顯然這樣的比賽結(jié)果難以令人信服。什么會(huì)出現(xiàn)這種情況呢?因?yàn)槠骄档拇笮∨c一組數(shù)據(jù)里的每個(gè)數(shù)據(jù)都有關(guān)系,其中任何數(shù)據(jù)的變動(dòng)都會(huì)引起平均值的變動(dòng)。如果數(shù)據(jù)中出現(xiàn)一兩個(gè)極端數(shù)據(jù),那么平均值對(duì)于這組數(shù)據(jù)所起的代表作用就會(huì)削弱。這里評(píng)委9給選手乙的打分遠(yuǎn)遠(yuǎn)低于其他評(píng)委,影響了平均值的代表性。評(píng)委9給選手乙所打的50分,遠(yuǎn)離其他人的打分,我們稱(chēng)這個(gè)數(shù)據(jù)值為異常值或離群值。
為了防止評(píng)委因?yàn)閭€(gè)人偏見(jiàn)而給出過(guò)高或者過(guò)低分?jǐn)?shù),人們想出了上述“去掉一個(gè)最高分,去掉一個(gè)最低分”的評(píng)分方法。這樣可以避免異常值造成的影響。這種將少數(shù)異常值去掉后計(jì)算的均值也叫截尾均值。如果去掉最高分和最低分,我們來(lái)算一算,甲、乙兩位選手的平均得分分別是多少?容易計(jì)算得:甲選手的平均分是77.86,乙選手的平均分是80。這樣比賽結(jié)果就是乙選手成績(jī)優(yōu)于甲選手。顯然這個(gè)結(jié)果比較公正。
截尾均值由于去掉了數(shù)據(jù)中影響數(shù)據(jù)穩(wěn)定性的異常值,從而具有較好的穩(wěn)健性。如果沒(méi)有出現(xiàn)反常情況,去掉最高、最低分對(duì)平均分的影響是不大的。綜合上述分析,我們知道:賽事組織者不講情面的做法,是為了減少異常值對(duì)評(píng)分的影響,從而獲得較為公正地反映選手水平的平均指標(biāo)。
]]>