30. 評量過程中,有時難以避免評分者誤差,下列何者不太可能是造成評分者誤差的原因?
(A)趨中偏誤(central tendency error)
(B)月暈效應
(C)評量次數太少
(D)樣本選擇偏誤
統計: A(794), B(467), C(2371), D(3184), E(0) #3244834
詳解 (共 10 筆)
月暈效應:指的是當評分者在評分時,只根據受評者的某部分表現(好的或壞的)類推做為全面評分的依據
評分者誤差(Rater Errors)通常指的是評分者在評量過程中,因個人主觀因素或認知偏差,影響評分的準確性。以下是選項的分析:
✅ (A) 趨中偏誤(Central Tendency Error) → 可能造成評分者誤差
- 指評分者傾向給中間分數,避免給太高或太低的分數,導致評分失去區辨度。
✅ (B) 月暈效應(Halo Effect) → 可能造成評分者誤差
- 指評分者因受某個特定特質(如學生平時表現好)影響,導致在其他項目上也給予較高評價,而非基於實際表現。
✅ (C) 評量次數太少 → 可能造成評分者誤差
- 當評量次數太少時,可能因評分者當時的主觀印象或少量數據影響,無法準確衡量學生的真實能力。
❌ (D) 樣本選擇偏誤(Sampling Bias) → 不太可能是評分者誤差的原因
- 樣本選擇偏誤通常是研究設計或數據收集時產生的問題,而非評分者在評量過程中的主觀誤差,因此較不屬於評分者誤差的範疇。
造成評分者誤差的原因:
1) 評分次數過少
2) 月暈效應
3) 偏見
趨中傾向(Central Tendency):
考評者因為難以區分受評人間的績效差距,使得分數都集中於中間區段,無法顯示區別效度。
❌ (D) 樣本選擇偏誤(Sampling Bias) → 不太可能是評分者誤差的原因樣本選擇偏誤通常是研究設計或數據收集時產生的問題,而非評分者在評量過程中的主觀誤差,因此較不屬於評分者誤差的範疇。
這題考驗的是對「評量誤差」來源的細緻分辨。在教育評量中,誤差通常分為「評分者內部」的心理偏差,以及「施測程序」或「工具」本身的問題。
我們來分析一下為什麼 (D) 樣本選擇偏誤 是最不相關的選項,並釐清其他容易混淆的概念:
? 評分者誤差 (Rater Errors) 的真面目
「評分者誤差」是指評分者在打分數時,因為主觀心理因素導致給分不公正。
-
(A) 趨中偏誤 (Central Tendency Error):評分者不敢給極高或極低的分數,所有人通通打 70-80 分。這是一種典型的評分心理。 ?
-
(B) 月暈效應 (Halo Effect):評分者對學生的某種特質(如:長得可愛、禮貌好)印象太好,導致在評分「作文能力」或「數學邏輯」時也給了高分。 ?
-
(C) 評量次數太少:這雖然看起來像是「程序問題」,但在統計上,次數太少會放大評分者當下的主觀偏見(例如:那天評分者心情不好)。增加次數可以透過「平均」來抵銷個人的偶然誤差。 ?
? 為什麼選擇 (D)?
(D) 樣本選擇偏誤 (Sampling Bias) 通常發生在「研究設計」或「標準化測驗」的編製階段。 例如:你想了解全國國中生的數學程度,卻只找建中、北一女的學生來施測。這會導致結果無法推論到全體,但這屬於**「取樣」的問題,而不是評分者在打分數時產生的「評分主觀偏誤」**。 ?