9.下列有關傳統試題分析的敘述,何者正確?
(A)試題難度愈高,鑑別度愈低
(B)試題鑑別度愈低,測驗效度愈低
(C)難度及鑑別度的估計屬於樣本依賴,並非固定不變
(D)某一試題的誘答選項,高分組學生的選答率高於低分組,則為優良試題
答案:登入後查看
統計: A(614), B(1850), C(4707), D(756), E(0) #2341128
統計: A(614), B(1850), C(4707), D(756), E(0) #2341128
詳解 (共 10 筆)
#4111003
(A)試題難度愈高,鑑別度愈低(X)
→從低難度到中難度,鑑別度會提高 p.s難度適中,鑑別度最高
(B)試題鑑別度愈低,測驗效度愈低(X)
→鑑別度低可能只是因為難度太高,可能依舊具有高效度
(C)難度及鑑別度的估計屬於樣本依賴,並非固定不變(O)
→不同的樣本做同樣一份測驗,會得到不同的難度與鑑別度
(D)某一試題的誘答選項,高分組學生的選答率高於低分組,則為優良試題 (X)
→誘答選項內,低分組學生的選答率高於高分組,表示為優良試題
271
1
#4062390
D)某一試題的誘答選項,低分組學生的選答率高於高分組,則為優良試題 .(誘答就是給低分組選答用的)
36
0
#6301956
(B) 試題鑑別度愈低,測驗效度愈低
我在這句選項卡很久,問了gpt之後統整一些想法跟邏輯給大家參考:
1. 鑑別度與難度兩者是跟信度有直接關係,而非效度,意即兩者與效度確實會有關係與互相影響,但不是完全的負相關。
2. (舉例為何這個選項不正確)例如:有一個簡單數學題目為「1+1=2」
因為太簡單,所以大家都答對,因此不太能區分高分與低分群→鑑別度低
但題目確實可以測出你會不會這個運算,所以效度高
我在這句選項卡很久,問了gpt之後統整一些想法跟邏輯給大家參考:
1. 鑑別度與難度兩者是跟信度有直接關係,而非效度,意即兩者與效度確實會有關係與互相影響,但不是完全的負相關。
2. (舉例為何這個選項不正確)例如:有一個簡單數學題目為「1+1=2」
因為太簡單,所以大家都答對,因此不太能區分高分與低分群→鑑別度低
但題目確實可以測出你會不會這個運算,所以效度高
16
0
#6414021
(A) 試題難度愈高,鑑別度愈低 錯誤
難度高,鑑別度不一定低;
最佳的鑑別度通常出現在中等難度(P 值約 0.4–0.6)的題目
ㅤㅤ
(B) 試題鑑別度愈低,測驗效度愈低 錯誤
雖然鑑別度低可能影響測驗整體效度,但效度是整份測驗與測量目標之間的關聯
單一試題鑑別度不高,不代表整份測驗效度低
ㅤㅤ
(C) 難度及鑑別度的估計屬於樣本依賴,並非固定不變 正確
試題難度(P 值)與鑑別度(D 值)是根據特定受試者樣本估算的,換不同考生作答就會改變
ㅤㅤ
(D) 某一試題的誘答選項,高分組學生的選答率高於低分組,則為優良試題 錯誤
高分組選錯誤選項的比例高,代表誘答不具區分力,反而是不良選項
優良誘答:低分組選的比例高,高分組較少選
ㅤㅤ
7
0
#5490410
但是如果信度低,效度不是一定低嗎?
2
0
#7338879
「樣本依賴」用最白話的方式說,就是:「分數的意義,要看你跟誰比。」
在傳統的考試理論中,這種現象會讓數據變得很「不客觀」,我們可以從兩個角度來看:
ㅤㅤ
1. 題目難不難?要看「誰來考」
- 例子: 一份國二數學考卷。
- 給「國中生」考:平均 60 分,看起來難度適中。
- 給「國小生」考:平均 10 分,看起來超級難。
- 給「大學生」考:平均 99 分,看起來超級簡單。
- 問題: 題目本身的難度數值(P值)會隨著「考試的人」是誰而變來變去。這就是難度依賴樣本。
ㅤㅤ
2. 學生強不強?要看「跟誰考」
- 例子: 小明某次段考 80 分。
- 在「後段班」:他是第一名,看起來超強。
- 在「資優班」:他是最後一名,看起來超弱。
- 問題: 同樣是 80 分,評價卻完全不同。這就是能力估計依賴樣本。
? 總結
「樣本依賴」就像是用一條會伸縮的尺來量身高:
- 對著矮子量,尺就縮短,讓你覺得自己很高。
- 對著巨人量,尺就伸長,讓你覺得自己很矮。
教育心理學家認為這是一個缺點,因為測驗結果會受群體組成影響,不夠穩定。所以後來才發明了 IRT(試題反應理論),想辦法做出一把「不會縮水」的鐵尺,讓題目難度和學生能力都能有固定的標準,不再受樣本影響。
0
0