【已刪除】20. 適度性指標(appropriateness index)係考生答題情形的內在證據顯示指標,可藉此反映其答題結果是否與其他具有相同
能力者一致。下列何者並非適度性指標的類型之一?
(A)邊緣機率(marginal probabilities)
(B)近似比值(likelihood ratios)
(C)估計能力變異量(estimated ability variation)
(D)試題測量標準誤(standard error of measurement)
統計: A(230), B(73), C(64), D(636), E(0) #210541
詳解 (共 10 筆)
適度性指標有三種(Levine & Rubin, 1979),各是以一種數量指標來表示,分別是:
-
邊緣機率(marginal probabilities)指標:此指標適用於一般正常的考生行為;即以某特定能力群體(如常態分配)中隨機抽取之考生的反應組型的條件機率為基準,求出同屬這一能力分配的群體考生的平均數,用以代表該考生之特定的反應組型的邊緣機率。當某位考生的反應組型出現不尋常時,即異常組型(aberrant pattern)(如:高能力考生答錯簡單的試題,或低能力考生答對困難的試題所形成的反應組型),他的邊緣機率值便可能相當的低;反之,則否。
-
近似比值(likelihood ratios):是以標準的近似比值分析技術,來針對通用的試題反應模式與另外的類化模式在適合用來分析考生的反應組型資料中,允許每個答題所需之能力都可以有所不同的情況下,各分別求出這兩種模式在該考生之反應組型上的機率的最大值,並比較其間的差值,看看該類化模式(generalized model)的適合度是否比通用的模式更好。
-
估計的能力變異量值(estimated ability variation):在允許每個答題所需之能力都可以有所不同的情況下,分別估計出模式的能力參數值及其估計值的變異數,並以此估計值作為衡量異常程度(degree of aberrance)的指標,故又稱為異常程度估計值。
適度性測量
在大規模的施測情境中,尤其是使用單選題(multiple choice item)作為測驗試題時,研究者往往會發現考生得分有下列各種奇怪現象產生,例如:
-
在施測前,考生死背某些很困難試題的答案,故能順利答題,遠超乎他能力所及;
-
高能力但低語文程度的考生,他的答題結果反映不出他的真正能力;
-
特別有創意的高能力考生發現有新穎的解題方法和解釋,但卻被當成錯誤來計分;
-
考生漏掉部份試題,致使後續的答案都填在不正確的位置上,導致一連串錯誤;
-
某些低能力的考生過度猜對遠非他能力所及的試題數;
-
某些考生的應試技巧過度保守,若非十分把握的試題,絕對是空白不答;
-
某些考生過度不熟悉測驗格式,導致胡亂猜題,甚至胡亂作答或以作弊方式來應付施測。
綜合上述現象,研究者因此會懷疑(1)考生的得分可能不是代表能力的一個適當測量值,(2)由試題與試題所構成的答題組型,可能會呈現不尋常(unusual)的狀態。因此,上述這些原因都會產生不尋常的答題組型(或稱反應組型(response pattern)),使得考生的得分不再代表他真正的實力。為了能夠從考生的反應組型中,找出這種代表不適當得分的不尋常反應組型來,於是便有「適度性測量」(appropriateness measurement)的研究誕生(Levine & Rubin, 1979; Levine & Drasgow, 1982);簡單的說,適度性測量便是用來找出這種不適當測驗得分(inappropriate test scores)的方法。
Levine & Rubin (1979, p. 271)對適度性測量作了一個定義:「適度性指標(appropriateness index)是一種對某個心理計量學模式與考生的反應組型間之適合度(goodness of fit)的簡單測量。如果考生在答案卷答題結果與其能力相仿的話,適度性指標應該會較高;反之,若答案卷上答題結果愈不像考生應有的能力作為時,則適度性指標應該會較低。就像考生的測驗得分一樣,考生的適當分數應該只是他在試題上的得分的唯一函數而已。因此,適度性指標是考生在答案卷上答題情形的內在證據的顯示指標,反映出他的答題結果是否與其他具有相同能力的人的答題結果相一致。」所以,適度性指標便是用來測量考生的反應組型是多麼不尋常的程度,典型的考生反應組型若偏離所期望的反應組型,則適度性指標便能顯示出他的不適當測驗得分,而不是用來矯正造成這種不適當分數的原因。
ps:邊緣機率值=異常程度指標(即因上述7項猜題所得的異常分數的程度)
近似比值(likelihood ratios):找到一個醫學上的解釋,可參考看看
我們希望真資訊越多越好,假情報越少越好。
因此,我們就可以使用「敏感性」(真陽性率,即真資訊)比上「1-特異性」(偽陽性率,即假情報)的比例,來評估一項檢測資訊的有用程度。這個比例,我們就稱之為「概似比」(likelihood ratio)
做考古題 細胞要死好幾萬= =+