主題:適度性測量


想要觀看完整全文,請先登入

適度性測量   在大規模的施測情境中,尤其是使用單選題(multiple choice item)作為測驗試題時,研究者往往會發現考生得分有下列各種奇怪現象產生,例如:       某些考生過度不熟悉測驗格式,導致胡亂猜題,甚至胡亂作答或以作弊方式來應付施測。         綜合上述現象,研究者因此會懷疑(1)考生的得分可能不是代表能力的一個適當測量值,(2)由試題與試題所構成的答題組型,可能會呈現不尋常(unusual)的狀態。因此,上述這些原因都會產生不尋常的答題組型(或稱反應組型(response pattern)),使得考生的得分不再代表他真正的實力。為了能夠從考生的反應組型中,找出這種代表不適當得分的不尋常反應組型來,於是便有「適度性測量」(appropriateness measurement)的研究誕生(Levine & Rubin, 1979; Levine & Drasgow, 1982);簡單的說,適度性測量便是用來找出這種不適當測驗得分(inappropriate test scores)的方法。   Levine & Rubin (1979, p. 271)對適度性測量作了一個定義:「適度性指標(appropriateness index)是一種對某個心理計量學模式與考生的反應組型間之適合度(goodness of fit)的簡單測量。如果考生在答案卷答題結果與其能力相仿的話,適度性指標應該會較高;反之,若答案卷上答題結果愈不像考生應有的能力作為時,則適度性指標應該會較低。就像考生的測驗得分一樣,考生的適當分數應該只是他在試題上的得分的唯一函數而已。因此,適度性指標是考生在答案卷上答題情形的內在證據的顯示指標,反映出他的答題結..

想要觀看完整全文,請先登入


關鍵字:適度性指標適度性測量inappropriate test scores