目錄 編輯

徐喬-經濟學

主題:測驗理論


想要觀看完整全文,請先登入

測驗理論一般劃分為兩大學派 一、傳統(古典)測驗理論CTT 是以真實分數為基礎而建立的傳統測驗理論(classical test theory)。基於弱勢假設(weak assumption),其主要內涵為「真實分數模式」(true score model),即觀察分數等於真實分數加上誤差分數 二、當代測驗理論MTT: 是以「試題反應理論IRT」為理論架構,在測驗理論上,自從Lord(1980)發表第一本以「試題反應理論」為名的專書後,當代測驗理論正式以試題反應理論為其中心架構。   「古典測驗理論」是最早的測驗理論,至今,它仍然是最實用的測驗理論,許多通用的測驗仍然是根據傳統方法來編製,並且建立起測驗資料間的實證關係。古典測驗理論也叫「古典信度理論」(classical reliability theory),因為,它的主要目的是在估計某個測驗實得分數(observed score)的信度;亦即,它企圖估計實得分數與真實分數(true score)間的關聯程度。因此,有時候它又稱作「真實分數理論」(true score theory), 因為它的理論來源都是建立在以「真實分數模式」(true score model)為名的數學模式基礎上。   古典測驗理論對測量問題所持的觀點,可以做如下的詮釋: 1.假設具有潛在特質存在。 2.多次測量的推論結果。 3.單獨一次的測量必有誤差存在。 4.假設潛在特質與誤差之間是獨立的。 5.複本測驗的嚴格假設。   古典測驗理論的優缺點 古典測驗理論的理論架構,主要是以真實分數模式為主,其理論模式的發展已為時甚久,且頗具規模,所採用的計算公式簡單明瞭、淺顯易懂,適用於大多數的教育與心理測驗情境,以及社會科學研究資料的分析,為目前心理計量學界應用與流通最廣的一種測驗理論。 古典測驗理論除了具備上述各項優點外,卻含有下列諸項缺失: 1. 古典測驗理論所採用的指標,諸如:難度(difficulty)、鑑別度(discrimination)、和信度(reliability) 等,都是一種樣本依賴(sample dependent)的指標;也就是說,這些指標的獲得,會因為接受測驗的受試者樣本的不同而不同,因此,針對不同潛在特質的樣本,同一份測驗很難獲得一致的難度、鑑別度、或信度等指標。 2. 古典測驗理論以一個共同的測量標準誤(standard error of measurement),作為每位受試者的潛在特質估計值的測量誤差指標;這種作法完全沒有考慮受試者反應的個別差異,對於具有高、低兩極端潛在特質的受試者而言,這種指標極為不合理且不精確,致使古典測驗理論模式的適當性受到懷疑。 3. 古典測驗理論對於非複本(nonparallel),但功能相同的測驗所獲得之量數間,無法提供有意義的比較;有意義的比較僅侷限在相同測驗的前後測量之量數或複本測驗分數之間而已。 4. 古典測驗理論對信度的假設,是建立在複本(parallel forms)測量概念的假設上;但是這種假設在實際的測驗情境裡,往往是不合理或不存在的。因為,在實際的測驗情境下,施測者不可能要求每位受試者在接受同一份測驗無數次後,而仍然保持每次反應結果都彼此獨立、互相不影響;況且,每一種測驗並不一定在編製測驗之時就同時製作複本。因此,複本測量的理論假設是行不通的,不論是從實際層面或方法學邏輯的觀點來看,它的假設既不切實際、又不合理、並且也是矛盾的。 5. 古典測驗理論忽視受試者作答的試題反應組型(item response pattern)所代表的意義,對於在原始得分上相同的受試者或正確反應總和相同的試題,即看成是潛在特質(如:能力)或試題參數(如:難度)的估計值相同。這種觀點其實是不正確的,因為,總分相同的受者或總和相同的試題,其試題反應組型不見得會完全一致,因此,試題反應組型所顯示的意義也不會相同,所估算出的潛在特質和試題參數估計值,應該也會不一樣。

想要觀看完整全文,請先登入


關鍵字:古典測驗理論測驗理論當代測驗理論真實分數