主題:測驗的基本概念_信度與效度

想要觀看完整全文，請先登入。

測驗的基本概念_信度與效度一、信度(reliability) (一)涵義信度是指用同一測驗重覆測量某項持久性特質時，得相同結果的程度；或指測驗多次所測得結果的一致性、穩定性。傳統理論中，古典信度理論用以估計個人在測驗上所得的實得分數，由真實分數、誤差分數組成。 X(實得分數)=T(真實分數)+e(誤差分數) 若由變異量的關係來解釋信度，則信度就是真實分數變異量在實得分數變異量中所佔的比例。 1.信度指數：測驗實得分數與真正分數的相關係數稱為「信度指數」。通常以該測驗的信度係數的平方根表示之。由於受試者在某項特質上的真實分數通常未知，只能從多次實得分數的平均值估計之。信度指數即是用一統計數做為估計值，以估計實得測驗分數與理論上真正分數之間的相關程度，亦即等於真正分數的標準差與實得分數的標準差之比，而其平方就是信度係數。 2.信度係數：指真實分數的變異數佔實得分數的變異數之百分比值。數學符號表示為rxx’ 或 r2xt。它的平方根為rxt，特稱作「信度指標」。信度係數介於0～1之間。數值越小，表示信度越高，也表示誤差越小。數值愈接近1，即表示信度愈好，多次測驗分數間的一致性愈高，測驗分數愈值得信賴。(最好是大於0 .80以上) (二)信度類型 1.再測信度(test-retest reliability)：指以同一份測驗於不同時間對同一批學生前後重複測量兩次，並根據這兩次測驗得分的結果，求出兩次得分間的相關係數。此種信度易受練習、記憶或身心成熟的影響，因此前後施測時間間隔必須適當。時間的間隔沒有一致的規定，端視測驗的性質及施測對象的特質而定。又稱穩定係數。誤差來源：時間抽樣、兩次測驗間隔時間 2.複本信度(alternative form reliability)：指兩份副本測驗間的測量結果的相關係數。若一套測驗有兩種以上的複本，則複本間可交互使用以避免再測信度的缺點。不過複本的產生並非容易，必須在題數、型式、難度、鑑別度等方面皆與原本一致。在同一個時間連續施測，又稱「等值係數」；間隔一段時間施測，類似重測法，又稱「穩定且等值係數」。誤差來源：時間抽樣、內容抽樣 3.內部一致性信度：再測信度或施測者內信度都使用相同測驗兩次或兩次以上。然而在一種測驗沒有複本(alternative form) 且只能施測一次的情況下可採用折半信度法，以了解測驗本身內容是否相互符合，因此此法又稱為內部一致性。 (1). 折半方法（split-half method）：將測驗題分前後半或單雙號半，而後求兩半間的相關性，這種方法只需施測一次即可得相關係數，而測驗題數愈長所得折半信度愈可靠。 *折半信度只用了半份測驗的信度，會低估原來試題長度的測驗信度→•斯布校正公式（Spearman-Brown formula）將折半信度加以還原估計 (2). K-R方法（Kuder-Richardson method） (3). α係數（coefficient alpha）誤差來源：內容抽樣、內容異質 4.評分者信度(inter-rater reliability)：兩個或兩個以上的施測者在同一時間對同一施測對象施測結果的一致性。誤差來源：評分者誤差 5.百分比一致性：以上四種信度類型主要用於常模參照，而百分比一致性用作於校標參照測驗的信度分析。分析前後兩次分類決定結果是否為一致的一種統計方法，並以百分比值之和來表示。二、效度(Validity) (一)涵義效度是指測驗分數的正確性；指測驗分數能夠代表它所要測量之能力或潛在特質的程度；或測驗能夠達到其編製目的的程度。若一個測量工具不能測出所要測的特質，則有再好的信度、再優良的施測步驟也都沒有用，因此我們可說效度是科學測量工具最重要的必備條件。測驗分數必然與所要測量之能力與潛在特質間有某種程度的關係（即共同變異部分），一個測驗分數的變異數X由共同因素的變異數Co、獨特的變異數Sp、誤差的變異數e 三部分所組成。效度是共同因素的變異數Co佔測驗分數變異數X的比率。效度亦可以1減去獨特變異數比率Sp和誤差變異數比率e之和來表示。效度係數的值域也是介於0與1之間，與信度係數的涵義相同。 (二)效度類型 1.內容效度(content validity)：(與內容關聯的效度) 指測驗試題是否能適當得測到編製目的所要的內容。學生的表現與測驗內容代表性樣本有關聯。 (1)邏輯的分析方法：可邀請學科或測驗專家來編製雙向計目表來判斷，又稱「專家效度」。 (2)實證的分析方法 2.效標關聯效度(criterion-related validity)：指測驗的結果與效標相關連的程度。而效標是指想用測驗來預測的某種特質或行為之參照標準。以實證分析方法研究測驗分數與外在效標的關聯性的指標。 (1) 同時效度(concurrent validity)：計算測驗分數和當前取得的效標之相關。可用來預估學生在效標上目前學習表現情形。 (2) 預測效度(predictive validity)：計算測驗分數和實施測驗經過一段時間後所取得的效標之相關。可用來預測學生未來在效標上的學習成就或表現情形。 3.建構效度(construct validity)：指測驗能測量到理論上的概念、結構或特質的程度。建構是心理學理論所說的抽象而屬假設性的概念，例如：智力、焦慮、動機等，這些概念的建構效度並不容易且非單一的研究而能建立的完全，而是必須累積許多的研究結果才得以更臻健全。 (1)內部一致性：以測驗總分為效標，計算各試題或分測驗與總分之相關，相關係數高表示該測驗內部之同質程度高，即表示該測驗傾向於測量同一心理結構。 (2)輻合效度／聚合效度(convergent validity)：計算新編測驗和相同構念或特質且已具有效度之不同測驗之相關係數，其數值大小反應該測驗效度之高低。 (3) 區別效度(discriminant validity)：檢驗新編測驗和不同構念或特質之其他測驗之相關，如所得相關係數極低或接近零，表示新編測驗不受到另外無關測驗之影響。 4. 表面效度(face validity) ：指受測者、測驗結果的使用者及一般大眾對於該測驗的試題和形式等所作的主觀判斷。很容易與內容效度混淆！但它不是內容效度，也不算真正的效度。三、信度與效度之間的條件關係：信度僅指測量結果是否一致、可靠、穩定，卻不涉及測量的東西是否正確；效度則針對測量的目的探討測驗能否測出所想要測量的特質。因此有可能一個測驗的多次結果皆非常的一致，但並不能測出我們所想要測的。信度是效度的必要而非充分條件，有信度的測驗不一定就有效，但有效度的測驗必定有信度。共同因素的變異數（ Sco ）佔整體實得分數變異數（即Sx）之百分比值，即為所定義的「效度」；而真實分數的變異數（即St）佔整體實得分數變異數之百分比值，即為所定義的「信度」。效度等於信度減去獨特變異數比率後所剩下的部分。信度是由共同變異數的比率與獨特變異數的比率所構成之和，亦即等於真實分數變異數的比率。（信度＝效度＋獨特性）

想要觀看完整全文，請先登入。

關鍵字:信度、效度

目錄 編輯

主題:測驗的基本概念_信度與效度

目錄編輯