【預告】5/13(一)起,第三階段頁面上方功能列以及下方資訊全面更換新版。 前往查看
高二上
阿摩第 8 期
6242枚
 4 

【分享】教檢考前“信度&效度”重點釐清

發表于: 2021/07/12


一、信度分析
信度(Reliability)即可靠性,它是指采用同樣的方法對同一對象重複測量時所得結果的一致性程度。信度指標多以相關係數表示,大致可分為三類︰穩定系數(跨時間的一致性),等值系數(跨形式的一致性)和內在一致性系數(跨項目的一致性)。信度分析的方法主要有以下四種︰
1、重測信度法
這一方法是用同樣的問卷對同一組被調查者間隔一定時間重複施測,計算兩次施測結果的相關系數。顯然,重測信度屬于穩定系數。重測信度法特別適用于事實式問卷,如性別、出生年月等在兩次施測中不應有任何差異,大多數被調查者的興趣、愛好、習慣等在短時間內也不會有十分明顯的變化。如果沒有突發事件導致被調查者的態度、意見突變,這種方法也適用于態度、意見式問卷。由於重測信度法需要對同一樣本試測兩次,被調查者容易受到各種事件、活動和他人的影響,而且間隔時間長短也有一定限制,因此在實施中有一定困難。
2、複本信度法
複本信度法是讓同一組被調查者一次填答兩份問卷複本,計算兩個複本的相關系數。複本信度屬于等值系數。複本信度法要求兩個複本除表述模式不同外,在內容、格式、難度和對應題項的提問方向等方面要完全一致,而在實際調查中,很難使調查問卷達到這種要求,因此採用這種方法者較少。
3、折半信度法
折半信度法是將調查項目分為兩半,計算兩半得分的相關系數,進而估計整個量表的信度。折半信度屬于內在一致性系數,測量的是兩半題項得分間的一致性。這種方法一般不適用于事實式問卷(如年齡與性別無法相比),常用于態度、意見式問卷的信度分析。在問卷調查中,態度測量最常見的形式是5級李克特(Likert)量表。進行折半信度分析時,如果量表中含有反意題項,應先將反意題項的得分作逆向處理,以保證各題項得分方向的一致性,然後將全部題項按奇偶或前后分為儘可能相等的兩半,計算二者的相關係數(rhh,即半個量表的信度系數),最後用斯皮爾曼-布朗(Spearman-Brown)公式︰求出整個量表的信度系數(ru)。
4、α信度系數法
Cronbach α信度系數是目前最常用的信度系數,α系數評價的是量表中各題項得分間的一致性,屬于內在一致性系數。這種方法適用于態度、意見式問卷(量表)的信度分析。
(給我最棒的統計課)

※影響信度的因素:
1.試題題數(測驗的長度)
2.樣本能力分配(團體分數的變異程度)
3.試題難易程度
4.測驗評分的客觀性
5.信度的估計方法


二、效度分析
效度(Validity)即有效性,它是指測量工具或手段能夠準確測出所需測量的事物的程度。效度分為三種類型︰內容效度、準則效度和架構效度。效度分析有多種方法,其測量結果反映效度的不同方面。常用于調查問卷效度分析的方法主要有以下幾種。
1、單項與總和相關效度分析
這種方法用于測量量表的內容效度。內容效度又稱表面效度或邏輯效度,它是指所設計的題項能否代表所要測量的內容或主題。對內容效度常採用邏輯分析與統計分析相結合的方法進行評價。邏輯分析一般由研究者或專家評判所選題項是否“看上去”符合測量的目的和要求。統計分析主要採用單項與總和相關分析法獲得評價結果,即計算每個題項得分與題項總分的相關係數,根據相關是否顯著判斷是否有效。若量表中有反意題項,應將其逆向處理后再計算總分。
2、準則效度分析
準則效度又稱為效標效度或預測效度。準則效度分析是根據已經得到確定的某種理論,選擇一種指標或測量工具作為準則(效標),分析問卷題項與準則的聯繫,若二者相關顯著,或者問卷題項對準則的不同取值、特性表現出顯著差異,則為有效的題項。評價準則效度的方法是相關分析或差異顯著性檢驗。在調查問卷的效度分析中,選擇一個合適的準則往往十分困難,使這種方法的應用受到一定限制。
3、結構效度分析
結構效度是指測量結果體現出來的某種結構與測值之間的對應程度。架構效度分析所採用的方法是因子分析。有的學人認為,效度分析最理想的方法是利用因子分析測量量表或整個問卷的架構效度。因子分析的主要功能是從量表全部變量(題項)中提取一些公因子,各公因子分別與某一群特定變量高度關聯,這些公因子即代表了量表的基本架構。透過因子分析可以考察問卷是否能夠測量出研究者設計問卷時假設的某種架構。在因子分析的結果中,用于評價架構效度的主要指標有累積貢獻率、共同度和因子負荷。累積貢獻率反映公因子對量表或問卷的累積有效程度,共同度反映由公因子解釋原變量的有效程度,因子負荷反映原變量與某個公因子的相關程度。在結束本文時應再次強調,為了提升調查問卷的質量,進而提升整個研究的價值,問卷的信度和效度分析絕非贅疣蛇足,而是研究過程中必不可少的重要環節。

※影響效度的因素:
1.測驗編制過程是否得當
2.施測程序與情境是否良好
3.受試者的身心反應因素
4.外在效標品質
5.樣本能力分配的變異程度

影響內在效度的因素
1.成熟(發生於較長時間的實驗)
2.選樣的差異
3.歷史事件(突發事件)
4.受試者亡佚(中途退出)--->偏差樣本
5.選樣與成熟的交互作用
6.測量工具的變化
7.測驗(測試經驗)
8.統計迴歸效應---->發生於(1)採極端選樣 (2)採前後測實驗設計
9.強亨利效應
10.怨恨性怠工
11.補償性均等(對控制組)---->白藥劑效應
12.實驗處理的擴散
13.統計分析
14.實驗者偏見

影響外在效度的因素:
1.施測的反作用效果:指採用前後測設計時,實驗的結果僅能推論至有前測的情境,而無法概括無前測的情境。
2.霍桑效應:實驗時,受試者知道自己正在參加實驗、正在被觀察,則足以使他表現得與平常非實驗情境不一樣,此種實驗安排的反作用效果,即稱為霍桑效應,其會影響實驗研究的外在效度,使結論的推論有困難。
3.選擇與實驗變項的交互作用:「實驗變項」本身的性質如何便足以使受試者選擇產生偏頗,如進行有關特殊教育方面的實驗,便容易在對特書教育方面有興趣的校長所服務的學校找到學生參加實驗,而用這樣偏頗的受試樣本實驗出來的結果,不一定能適用於其他學校。
4.重複實驗處理的干擾:同一組受試者重複揪受不同處理時,雖可增加實驗內在效度,但其外在效度卻可能反而降低,亦即此種重複處理的實驗結論較無法推論到非重複處理的情境。

信度是效度的必要但非充分條件。
關於這句話的意涵如果懂一點統計,就可 以從「變異」的角度來理解。在此我們就先省略此觀點,先依簡茂發的觀點來說明:
(一) 信度是效度的必要條件:即一個工具得先有好的信度,才有必要探討其效度,好的信度是一個測量工具的最基本條件。
(二) 信度是效度的非充分條件:即一個工具就算有高的信度,也未必會有好的效度。
所以,
信度高,效度未必高;
信度低,效度必 低;(其實當信度低,也就沒必要探討效度了,因為沒意義。)
效度高,信度必高;
效度低,信度未必低。

備註:
霍桑效應:實驗者因為知道被觀察而改變行為動機,導致與事實有出入亦即改變實驗結果
強亨利效應:對照組不甘於被比較或作為標準參照的心態而與實驗組較勁
受實驗者效應:對照組不願受到從眾效應的心態而刻意唱反調