19 國中基本學力測驗是依據那一種理論而編製？ (A)相關原理 (B)訊息加工論 (C)潛在特質理論 (D)傳統測驗理論

Michelle Chen

B3 · 2015/06/06

#1083260

　IRT理論即項目反應理論(Item Response Theory, IRT)，又稱題目反應理論、潛在特質理論（Item Response Theory）是一系列心理統計學模型的總稱。

35

0

Joan Chung

B2 · 2015/05/27

#1072190

國中基測為何要用IRT

1.兩次考試，考生有超過一次的施測機會，從中選出比較能夠代表真正能力的那一次的測驗分數

2.兩次考試在組卷前，就要先知道試題的難度，必須預試，並建立題庫。不同時間與不同樣本建立試題難度，必須要用IRT。

3.每次的分數，是考生的能力(θ)轉成量尺分數60分

4.兩次考完試的分數，要進行分數等化，沒有相同題、相同人也有學習進步的問題，僅能用用IRT進行等化。

兩者理論相異點

古典測驗理論與試題反應理論較明顯的差異有以下五點（方秀惠，2003；Hambleton &

Cook, 1977）：

（一）樣本的影響

古典測驗理論以反應正確受試者之百分比作為難度指標，以試題分數與測驗總分的相關係數作為鑑別度指標，這些代表試題特質的統計量數隨受試者能力水準而變，亦即這些統計量數係團體相依（group-dependent）；試題反應理論的試題參數，如難度參數及鑑別度參數，即使經過不同群體受試者的施測，仍舊可以保持不變，也就是說，試題參數之估計不受樣本不同的影響（sample-free）。

（二）試題難度的影響

古典測驗理論的觀察分數會隨測驗的難度而變，亦即觀察分數係依測驗而定（test-dependent），此現象造成不同受試者接受不同試題的結果難以直接比較；試題反應理論對受試者能力的估計則不受試題影響（item-free），且不同受試者的能力值可以直接互相比較。

（三）測量誤差

在古典測驗理論中，所有受試者接受一測驗的結果皆具有相同的測量誤差，無法反應出受試者間的個別差異；在試題反應理論，測量誤差之估計則因受試者能力水準的不同而異，因此對於不同能力水準受試者的能力估計值，可提供不同的準確度評估。

（四）測驗結果的解釋

在古典測驗理論中，測驗結果的解釋通常是將受試者在測驗中答對的試題予以計分，而忽視受試者答對試題的難度有高有低；在試題反應理論中，測驗結果的解釋則考慮試題難度的訊息，因此原始得分相同者，能力估計值未必相同。

15

0

Chen Yen-chen

B4 · 2016/05/15

#1342722

「古典測驗理論」是最早的測驗理論，也叫「古典信度理論」（classical reliability theory），因為它的主要目的是在估計某個測驗實得分數（observed score）的信度；亦即，它企圖估計實得分數與真實分數（true score）間的關聯程度。因此，有時候它又稱作「真實分數理論」（true score theory），因為它的理論來源都是建立在以「真實分數模式」（true score model）為名的數學模式基礎上。古典測驗理論的理論架構，主要是以真實分數模式為主，其理論模式的發展已為時甚久，且頗具規模，所採用的計算公式簡單明瞭、淺顯易懂，適用於大多數的教育與心理測驗情境，以及社會科學研究資料的分析，為目前心理計量學界應用與流通最廣的一種測驗理論。

古典測驗理論除了具備上述各項優點外，卻含有下列諸項缺失：

1. 古典測驗理論所採用的指標，諸如：難度（difficulty）、鑑別度（discrimination）、和信度（reliability）等，都是一種樣本依賴（sample dependent）的指標；也就是說，這些指標的獲得，會因為接受測驗的受試者樣本的不同而不同，因此，針對不同潛在特質的樣本，同一份測驗很難獲得一致的難度、鑑別度、或信度等指標。

2. 古典測驗理論以一個共同的測量標準誤（standard error of measurement），作為每位受試者的潛在特質估計值的測量誤差指標；這種作法完全沒有考慮受試者反應的個別差異，對於具有高、低兩極端潛在特質的受試者而言，這種指標極為不合理且不精確，致使古典測驗理論模式的適當性受到懷疑。

3. 古典測驗理論對於非複本（nonparallel），但功能相同的測驗所獲得之量數間，無法提供有意義的比較；有意義的比較僅侷限在相同測驗的前後測量之量數或複本測驗分數之間而已。

4. 古典測驗理論對信度的假設，是建立在複本（parallel forms）測量概念的假設上；但是這種假設在實際的測驗情境裡，往往是不合理或不存在的。因為，在實際的測驗情境下，施測者不可能要求每位受試者在接受同一份測驗無數次後，而仍然保持每次反應結果都彼此獨立、互相不影響；況且，每一種測驗並不一定在編製測驗之時就同時製作複本。因此，複本測量的理論假設是行不通的，不論是從實際層面或方法學邏輯的觀點來看，它的假設既不切實際、又不合理、並且也是矛盾的。

5. 古典測驗理論忽視受試者作答的試題反應組型（item response pattern）所代表的意義，對於在原始得分上相同的受試者或正確反應總和相同的試題，即看成是潛在特質（如：能力）或試題參數（如：難度）的估計值相同。這種觀點其實是不正確的，因為，總分相同的受者或總和相同的試題，其試題反應組型不見得會完全一致，因此，試題反應組型所顯示的意義也不會相同，所估算出的潛在特質和試題參數估計值，應該也會不一樣。

12

0

Yu-chieh Wang

B5 · 2017/05/20

#2203359

潛在特質理論Latent Trait T...

(共 310 字，隱藏中）

前往觀看

8

0

은혜

B1 · 2015/02/24

#996624

why??
請問傳統測驗是什麼呢??

1

0

香如故

B6 · 2022/10/06

#5627179

古典測驗理論主要描述了測量誤差是如何的影響觀察值。一般的測驗概念(如信度、效度)或從文獻中所看到的測驗研究，十之八九是從古典測驗理論而來的。
^{來源：古典測驗理論}

試題反應理論建立在兩個基本概念上：
1.受試者在某一試題上的表現情形，可由一個（或一組）因素來加以預測或解釋，該因素即稱作「潛在特質」或「能力」
2.受試者的作答表現情形與該組潛在特質之間的關係，可以透過一條連續性遞增的數學函數來表示，這條數學函數便稱作「試題特徵曲線」。
^{來源：試題反應理論/潛在特質理論（IRT）}

0

19 國中基本學力測驗是依據那一種理論而編製？
(A)相關原理
(B)訊息加工論
(C)潛在特質理論
(D)傳統測驗理論

詳解 (共 6 筆)

相關試題

相關試卷