19 國中基本學力測驗是依據那一種理論而編製?
(A)相關原理
(B)訊息加工論
(C)潛在特質理論
(D)傳統測驗理論
統計: A(51), B(87), C(608), D(464), E(0) #706769
詳解 (共 6 筆)
IRT理論即項目反應理論(Item Response Theory, IRT),又稱題目反應理論、潛在特質理論(Item Response Theory)是一系列心理統計學模型的總稱。
「古典測驗理論」是最早的測驗理論,也叫「古典信度理論」(classical reliability theory),因為它的主要目的是在估計某個測驗實得分數(observed score)的信度;亦即,它企圖估計實得分數與真實分數(true score)間的關聯程度。因此,有時候它又稱作「真實分數理論」(true score theory), 因為它的理論來源都是建立在以「真實分數模式」(true score model)為名的數學模式基礎上。古典測驗理論的理論架構,主要是以真實分數模式為主,其理論模式的發展已為時甚久,且頗具規模,所採用的計算公式簡單明瞭、淺顯易懂,適用於大多數的教育與心理測驗情境,以及社會科學研究資料的分析,為目前心理計量學界應用與流通最廣的一種測驗理論。
古典測驗理論除了具備上述各項優點外,卻含有下列諸項缺失:
1. 古典測驗理論所採用的指標,諸如:難度(difficulty)、鑑別度(discrimination)、和信度(reliability) 等,都是一種樣本依賴(sample dependent)的指標;也就是說,這些指標的獲得,會因為接受測驗的受試者樣本的不同而不同,因此,針對不同潛在特質的樣本,同一份測驗很難獲得一致的難度、鑑別度、或信度等指標。
2. 古典測驗理論以一個共同的測量標準誤(standard error of measurement),作為每位受試者的潛在特質估計值的測量誤差指標;這種作法完全沒有考慮受試者反應的個別差異,對於具有高、低兩極端潛在特質的受試者而言,這種指標極為不合理且不精確,致使古典測驗理論模式的適當性受到懷疑。
3. 古典測驗理論對於非複本(nonparallel),但功能相同的測驗所獲得之量數間,無法提供有意義的比較;有意義的比較僅侷限在相同測驗的前後測量之量數或複本測驗分數之間而已。
4. 古典測驗理論對信度的假設,是建立在複本(parallel forms)測量概念的假設上;但是這種假設在實際的測驗情境裡,往往是不合理或不存在的。因為,在實際的測驗情境下,施測者不可能要求每位受試者在接受同一份測驗無數次後,而仍然保持每次反應結果都彼此獨立、互相不影響;況且,每一種測驗並不一定在編製測驗之時就同時製作複本。因此,複本測量的理論假設是行不通的,不論是從實際層面或方法學邏輯的觀點來看,它的假設既不切實際、又不合理、並且也是矛盾的。
5. 古典測驗理論忽視受試者作答的試題反應組型(item response pattern)所代表的意義,對於在原始得分上相同的受試者或正確反應總和相同的試題,即看成是潛在特質(如:能力)或試題參數(如:難度)的估計值相同。這種觀點其實是不正確的,因為,總分相同的受者或總和相同的試題,其試題反應組型不見得會完全一致,因此,試題反應組型所顯示的意義也不會相同,所估算出的潛在特質和試題參數估計值,應該也會不一樣。
請問傳統測驗是什麼呢??
古典測驗理論 主要描述了測量誤差是如何的影響觀察值。一般的測驗概念(如信度、效度)或從文獻中所看到的測驗研究,十之八九是從古典測驗理論而來的。
來源:古典測驗理論
試題反應理論 建立在兩個基本概念上:
1.受試者在某一試題上的表現情形,可由一個(或一組)因素來加以預測或解釋,該因素即稱作「潛在特質」或「能力」
2.受試者的作答表現情形與該組潛在特質之間的關係,可以透過一條連續性遞增的數學函數來表示,這條數學函數便稱作「試題特徵曲線」。
來源:試題反應理論/潛在特質理論(IRT)