主題:各種效度的比較


想要觀看完整全文,請先登入

各種效度的比較 構念效度(construct validity) 構念效度就是指測驗能夠測量到理論上的構念或特質的程度。易言之,就是指測驗分數能夠依據某種心理學的理論構念加以解釋的程度。 內容效度(content validity) 指測驗內容的代表性或取樣的適切性 該衡量工具能足夠涵蓋主題的程度。從測量工具的內容來檢查,看看是否符合測量目標所預期的內容。 同時效度(concurrent validity) 同時效度是指測驗分數與實施測驗同一時間所取得的效標之間的相關。 想要預測某事情的結果或估計某種現存的行為或現象。以其他測量為標準(習稱效標),將測量結果與效標作一比較,若彼此相關程度愈大,顯示效度愈高,反之亦反。 預測效度(predictive validity) 預測效度是指測驗分數與實施測驗後一段時間所取得的效標之間的相關,旨在使用測驗分數預測個人在效標方面的未來表現。 外部效度(External Validity) 外在效度是指實驗結果的可推論性之程序的大小,實驗結果的可推論性愈大,亦即其適用性,代表性愈大,實驗的外在效度則愈高。易言之,就是指實驗研究結果是否可推論到研究對象以外的其他受試者,或研究情境以外的其他情境。 獲得研究結果是否能推論/一般化( generalizibility )。 母體效度(Population Validity):樣本推論至所代表母體的程度。 生態效度(Ecological Validity):樣本推論至其他母體的程度,外在效度的一種,指情境的可推論性,亦即根據研究情境的研究結果能否推論到不同情境的信心程度。 影響生態效度(ecological validity)的因素(影響推論至非研究的一般情境) 研究變項與情境敘述不清:結果的試用情境和範圍不清楚 重複實驗的干擾:非實驗不太可能重複處理 實驗效應:霍桑效應,受試者表現過度積極 實驗情境的新奇或干擾:新奇情境無法類推 實驗者效應:主試者暗示或鼓勵,促成受試者的不同表現 前測效應:引起注意 後側效應:提供個體表現機會,所以有後測的效應。一般情境只有處理,無後測,無法推論一般情境。 特殊事件影響 依變項的測量:有些測量工具無法在一般情境被了解或採納。 實驗效果的時間性:實驗時間常和一般情境不同,推論的精確性限制。 http://coolcool-bemyself.blogspot.tw/2010/06/blog-post.html }效度:一個測驗能夠測量出所預測量的性質(正確性),一份良好心理測驗在評量上最重要的特徵,例如用磅秤測量身高,或用尺測量時間,所用的工具不妥,效度便差。在考試測驗,效度高,代表有測得需要的特質與學習成果。 (1)內容效度(取樣效度、課程效度、邏輯效度):測驗內容是否符合教材內容與教學目標ex: 成就測驗、熟練測驗     例如,在成就測驗中,測驗題目是根據教學大綱和教材內容適當抽出的,內容效度就是判斷測驗題目(內容)是否符合它欲測的目標。由於這種衡量效度的方法必須針對課程的目標和內容,以系統的邏輯方法詳細分析題目的性能,故又稱課程效度或邏輯效度。(教師在編製某科成就測驗時,應注重內容效度) 內容效度是指題目的內容,與評量目標的一致性程度。通常較適用在成就測驗的效度考驗上。 而較常評量內容效度的方法為「雙向細目表」(two-way specification table):包括教學目標與教材內容兩個向度。 w雙向細目表之定義 雙向細目表示測驗的架構藍圖它描述了一份測驗中所應該包含的內容以及所評量到的能力,也是命題的依據。它是以教學目標和學習內容為兩個軸,分別說明各項評量目標。 1.教學目標(以橫軸表示):以Bloom所提的認知領域六個教學目標為依據:知識、理解、應用、分析、綜合、評鑑。(此次編製成就測驗的歷程,可將分析、綜合、評鑑,統合成「高層次思考」) 2.教材內容(以縱軸表示):以出題的範圍,表示出包含幾個不同的單元。 w雙向細目表之用途 建立雙向細目表可以幫助命題者釐清教學目標和學習內容的關係,以確保測驗能反映教材的內容,並能夠真正評量到預期之學習結果。 3.內容效度指的是測驗的內容所能代表教學目標和教材內容的程度。 在學校教育上所編製的各種學科成就測驗,測驗題目的選擇,必須根據教科書的內容,而在題目的數量及範圍上,也必須對教材的廣度與難度具有代表性,否則,施測後的分數即不足以有效地表示學生學得的成就。按教材內容的代表性為標準所建立的測驗效度 (2)效標關聯效度(實證效度、統計效度):以驗證性的方法,來探討測驗分數與一些外在效標之間的關係;使用中的衡量工具和其他的衡量工具來比較兩者是否具有關連;必須有一個參照團體的分數可供對照,可用來預測(某數學科教師自編測驗分數,可以用來預測基本學力測驗的數學成績,即為「效標關聯效度」之應用),是實用性最高的一種效度。     就是以其他獨立、可信度高的測量為標準(也就是效標),將我們的測量結果與效標作一比較,若彼此相關程度愈大,顯示效度愈高,反之亦反。 例如,英文老師給學生做一個英文能力的檢定,如果在測驗中得分高的同學在全民英檢中也得高分。則此測驗就具有效標關聯的效度。 共包含兩種:    同時效度:根據衡量工具與目前某種衡量校標的相關程度,用以衡量本研究衡量工具之有效性;測驗分數與「當前」實際表現相關係數;指測驗分數與實施測驗同一時間所取得的效標之間的相關(效標分數和測驗分數同時取得,目的使用測驗分數估計個人在效標方面的目前實際表現)。想要預測某事情的結果或估計某種現存的行為或現象。ex: 診斷測驗、成就測驗(如:校內的數學段考);ex新編職業測驗(employment test)-目前工作成績;新編英語成就測驗-在校英語段考成績。    預測效度:一個測驗對出於特定情景中的個體的行為進行於預測的有效性,也就是對我們所感興趣的行為能够預測到什麼程度;測驗分數與 「一段時間後」實際表現相關係數,效標分數在測驗實施後一段時間取得,目的使用測驗分數預測個人在效標方面的未來表現。ex: 性向測驗、(智力測驗)(如:教甄,關鍵字在"潛力")、新編職業測驗-錄取後一段時間後的工作成績,預測效度對於人員選擇與分類的測驗最為適當。 (3)建構(構念)效度:測驗分數能依理論構念加以解釋的程度,是一個範圍很廣的概念,它涵蓋「內容效度」及「效標關聯效度」。ex:人格測驗 Ö(A)人格測驗最適宜用下列哪一種信度係數?(A)α係數(B)複本信度(C)庫李信度(D)評分者間信度。 動作(與人格測驗) 重測信度 人格測驗 內部一致性信度 α係數 (多重記分) 速度測驗 複本信度 實作評量 概化信度係數 (A)區辨效度:一測量工具測量二者不同的構念,其相關很低。 (例如:一份性向測驗可以測出語言、空間等等不同的能力) (B)聚歛效度:兩個不同的測量工具,測量同一個體的結果,其相關值很高。 (例如:兩份不同的智力測驗都是在測量學生的智力) (C)內容效度:指測驗內容的代表性程度。 (D)效標關聯效度:指測驗分數和效標分數之間的相關係數。 ◎構念效度:指測驗能夠測量到理論上的構念或特質的程度。   某教授為了驗證其「自編憂鬱量表」之效度,採用已經廣泛使用的「貝克憂鬱量表」 總分與「自編憂鬱量表」得分之皮爾森積差相關係數來驗證,此作法稱為下列何者? (A)區辨效度 (B)聚斂效度 (C)內容效度 (D)效標關聯效度 →強調以自編測驗和效標分數(自編憂鬱量表)間的相關來檢驗其效度 (聚歛效度的話兩個測驗工具比較是平等的,但題目很明顯是以廣泛使用的「貝克憂鬱量表」做為效標)   林教授使用現有的測驗工具作為檢驗新編測驗是否具有效度的依據,請問該效度為下列哪一種? (A) 專家效度 (B)內容效度 (C)效標效度 (D)構念效度 →沒有提到「相關」字眼,問題的焦點在「是檢驗哪一種效度」(這題出得不好) 效度:一份測驗可以測出所要測量的特質 (例如:智力測驗 可以測出 智力 →有效) 內容效度:大多用於成就測驗 (要測出學生所學的"課程內容") 效標關聯效度(測驗分數與效標分數之相關),依 "效標取得的時間" 可分為:     1.同時效度:當前效標→例如:數學段考分數─數學平時分數(當前效標) 之相關     2.預測效度:未來效標→例如:教甄分數高(測驗分數)→"預測"未來教學表現高(效標)  若相關高,則效度高 建構效度:測驗結果符合變項、概念、理論的程度(涵義最廣,常用因素分析法)                   →例如:人格測驗依據 "人格理論" 編製,再依據該理論解釋測驗結果 ※考驗建構效度的方法  1 內部一致性(1)團體對照法                       (2)相關方法                       (3)計算分測驗和總分的相關  2 外在相關法 3 因素分析法:多變數統計分析法 步 驟 (1)利用相關矩陣(Marix)求取(特徵值大於因素負荷量因素解釋量)前測影響性,用共變數分析 4 團體差異的分析  5 實驗處理:但要注意是否有前測影響性,用共變數分析 6多項特質-多項方法分析:Campell  & Fiske多重方法矩陣  (1) 輻合性效度:一個測驗的分數要與其他測量高相關。(簡單來說,用不同方法測量相同特質)  (2) 區別性效度:一個測驗的分數要與其他測量低相關。(簡單來說,用相同方法測量不同特質) http://yamol.tw/note.php?id=1470 資料來源:http://n91074.pixnet.net/blog/post/23444668 效標關聯效度可以依照效標取得的時間分成下列幾種:(1) 同時效度Concurrent Validity: 指效標分數與測驗分數同時取得,因此可以估計測驗分數在效標方面的實際表現。例如社工在執行課輔活動時可以設計一個英文成就測驗A,讓學生在段考前一天施測,之後再將測驗的成績A1與學生在學校的英文段考分數B1(英文段考考卷是B)作比較,如果成就測驗的成績A1與學校段考成績B1呈現高度相關,那我們可以說你的成就測驗具有同時效度(表示學生的英文成就測驗分數越高,其段考成績也會越高;雖然聽起來成就測驗A有預測的效果,但因為兩者的分數幾乎是同時取得,所以稱為同時效度)。(2) 預測效度Predictive Validity:指測驗分數與將來效標資料之相關程度;若相關係數高,則測驗工具的預測效度越高。例如高中時,輔導室曾讓我們填寫就業性向測驗,此一測驗即可用預測效度來檢驗其效度;在這邊,效標就是我們未來的職業,研究者可以在數年後做電話追蹤,了解受試者在數年後的職業發展,如果結果跟當初的測驗成績有很高的相關,則這份測量工具有很高的預測效度。此外,我們也可以拿第一次段考成績跟第二次段考成績來做預測效度的檢驗(因兩者不是同時取得)。(3) 區分效度Differential Validity:拿兩種不同的測驗工具當做效標,分別與我們設計的工具的測驗結果求算相關係數,兩者的差即為區分效度。如上例,我們拿兩種不性質的就業性向問卷作為校標,分別計算與我們的測驗分數的相關係數,兩者的差可以表示擇業的成功性。 主旨是要了解這份題目出來的結果(評量分數)是不是符合我要測的目標(如:智力),也就是測驗的精準性,但我們智力這些又無法用任何儀器準確測量。所以它就用與其他相關測驗或不同測驗結果的相關性(高/低),來推測這份測驗是否有精準性: 因而,它又分了二種: 區別效度:測驗a 和測驗b (兩者的目的、構念、特質:不同),考驗兩測驗的分數的相關性-->結果是低相關 輻合效度:測驗a 和測驗b (兩者的目的、構念、特質:相同),考驗兩測驗的分數的相關性-->結果是高相關 我是這樣想的:因為構念效度很難直接套公式算出來,                          所以就找不同目標的測驗來比較看它們有沒有相關(區別效度),沒有相關就代表它們真的不一樣,(效度高)                                                                                                             有相關就代表有一份測驗的目標設定有問題(效度低)                           相反的,如果找到一樣目標的測驗來比較看它們有沒有相關(輻合效度),有相關就代表它們真的一樣,(效度高)                                                                                                             沒有相關就代表有一份測驗的目標設定有問題(效度低)   內在效度的因素:因同時影響實驗組或對照組(如同時事件),                           或影響之後不增加考驗達顯著的機率(如強亨利造成對照組分數提高,統計結果不顯著),                           所以只影響內在效度。 外在效度的因素:造成實驗達顯著,但並非實驗處理的原因,故無法推論(如霍桑)。 一、內容效度 內容效度是指題目的內容,與評量目標的一致性程度。通常較適用在成就測驗的效度考驗上。 而較常評量內容效度的方法為「雙向細目表」(two-way specification table):包括教學目標與教材內容兩個向度。 二、雙向細目表之定義 雙向細目表示測驗的架構藍圖它描述了一份測驗中所應該包含的內容以及所評量到的能力,也是命題的依據。它是以教學目標和學習內容為兩個軸,分別說明各項評量目標。 1.教學目標(以橫軸表示) 以Bloom所提的認知領域六個教學目標為依 據:知識、理解、應用、分析、綜合、評鑑。 (此次編製成就測驗的歷程,可將分析、綜合、評鑑,統合成「高層次思考」) 2.教材內容(以縱軸表示) 以出題的範圍,表示出包含幾個不同的單元。 三、雙向細目表之用途 建立雙向細目表可以幫助命題者釐清教學目標和學習內容的關係,以確保測驗能反映教材的內容,並能夠真正評量到預期之學習結果。 影響內在效度的因素 1.成熟(發生於較長時間的實驗) 2.選樣的差異 3.歷史事件(突發事件) 4.受試者亡佚(中途退出)--->偏差樣本 5.選樣與成熟的交互作用 6.測量工具的變化 7.測驗(測試經驗) 8.統計迴歸效應---->發生於(1)採極端選樣                                       (2)採前後測實驗設計 9.強亨利效應 10.怨恨性怠工 11.補償性均等(對控制組)---->白藥劑效應 12.實驗處理的擴散 13.統計分析 14.實驗者偏見 建構效度: 1.又稱作構念效度 2.可以測得理論上的概念或特質程度 3.驗證方法: (1)因素分析~最有效。適用於人格分析上。 (2)多重特質-多項方法~又可以分為兩種 a.收斂(輻合、聚斂)效度上--適用於"同理論""同特質"要高相關                                                        b.區辨(辨別)效度上--適用於"不同理論""不同特質"要低相關 例題:利用自陳量表和社會計量法分別測量某一群受試者之焦慮分數,再求此兩種分數的積差相關,得了高相關。此結果提供了何種證據?(A)區別效度 (B)輻合效度 (C)同時效度 (D)預測效度。   答案是~輻合效度,因為兩種量表都是測量"焦慮" 一、內容效度內容效度是指題目的內容, 與評量目標的一致性程度。通常較適用在成就測驗的效度考驗上。 而較常評量內容效度的方法為「雙向細目表」(two-way specification table): 包括教學目標與教材內容兩個向度。   二、雙向細目表之定義 雙向細目表示測驗的架構藍圖它描述了一份測驗中所應該包含的內容以及所評量到的能力,也是命題的依據。它是以教學目標和學習內容為兩個軸,分別說明各項評量目標。   1.     教學目標(以橫軸表示) 以Bloom所提的認知領域六個教學目標為依 據:知識、理解、應用、分析、綜合、評鑑。  (此次編製成就測驗的歷程,可將分析、綜合、評鑑,統合成「高層次思考」)   2.     教材內容(以縱軸表示) 以出題的範圍,表示出包含幾個不同的單元。   三、雙向細目表之用途建立雙向細目表可以幫助命題者釐清教學目標和學習內容的關係, 以確保測驗能反映教材的內容,並能夠真正評量到預期之學習結果。 效度:如測身高用尺、測體重用體重計! 增加題目的難度並不能提高有效度! 台師大科教中心研究員任宗浩表示,以古典測驗理論而言,有四項指標可用於分析考題,分別是「信度」、「效度」、「難度」及「鑑別度」。  信度指的是一致性與可靠性,測量結果是否正確,重複測量能否得到相同結果,舉例來說,若以以磅秤測量體重,第一次測得50公斤、第二次卻是60公斤、第三次又變成40公斤,該磅秤的「信度」便很差。在考試測驗,信度高,即代表該份試題能如實反應考生的能力。  效度指是否測得需要的結果,例如用磅秤測量身高,或用尺測量時間,所用的工具不妥,效度便差。在考試測驗,效度高,代表有測得需要的特質與學習成果。  鑑別度及難度則是用於試題分析。鑑別度指測驗所能分析最小的量,以測量櫻桃的大小為例,以最小單位為0.1公分的量尺測量,能區分直徑3.2公分及3.3公分的櫻桃,若以最小單位為1公分的量尺測量,就只能區分3公分與4公分的人,要區分的越細膩,量尺工具就必須越精細。一般農場在測量櫻桃品質,會以挖洞的工具區分大小,若有3個洞,便能測出4種等級;有10個洞,便能測出11種等級。  而洞的直徑也有意義,若開的是20公分的洞,所有櫻桃都能通過,該洞沒有意義,同樣地,只開0.5公分的洞也是一樣。 古典測驗四大指標—信度、效度、難度、鑑別度  台師大科教中心研究員任宗浩表示,以古典測驗理論而言,有四項指標可用於分析考題,分別是「信度」、「效度」、「難度」及「鑑別度」。  信度指的是一致性與可靠性,測量結果是否正確,重複測量能否得到相同結果,舉例來說,若以以磅秤測量體重,第一次測得50公斤、第二次卻是60公斤、第三次又變成40公斤,該磅秤的「信度」便很差。在考試測驗,信度高,即代表該份試題能如實反應考生的能力。  效度指是否測得需要的結果,例如用磅秤測量身高,或用尺測量時間,所用的工具不妥,效度便差。在考試測驗,效度高,代表有測得需要的特質與學習成果。  鑑別度及難度則是用於試題分析。鑑別度指測驗所能分析最小的量,以測量櫻桃的大小為例,以最小單位為0.1公分的量尺測量,能區分直徑3.2公分及3.3公分的櫻桃,若以最小單位為1公分的量尺測量,就只能區分3公分與4公分的人,要區分的越細膩,量尺工具就必須越精細。一般農場在測量櫻桃品質,會以挖洞的工具區分大小,若有3個洞,便能測出4種等級;有10個洞,便能測出11種等級。  而洞的直徑也有意義,若開的是20公分的洞,所有櫻桃都能通過,該洞沒有意義,同樣地,只開0.5公分的洞也是一樣。 效度分類 定義 影響因素 歷年題目考點 內在效度 能夠有效的實驗出所要實驗的因果關係 ★可信度 (1)統計回歸現象   天花板效應   地板效應 (2)強亨利效應 (3)測量工具 (4)同時事件 (5)成熟度 (6)樣本死翹翹 …..很多XD ★實驗研究中實驗處理的擴散 ★實驗研究中研究期間的事件 ★用建構式教學法進行教學實驗, 實驗中學生數學成績的改變 (教學法實驗首先考慮內在效度) ★研究對象的成熟 ★前測經驗 外在效度 實驗結果是否可推論到研究情境以外或研究對象以外的受試者 ★可轉換性 (1)霍桑效應 (2)實驗者效應 ★國中老師在思考自己的 實驗結果能否類推到國小的情境 以射飛鏢為例 : 射得中箭靶(信度)不一定正中紅心(效度) :信度高,效度不一定高 如果射到紅心就一定射中箭靶: 效度高,信度一定高                          (B)異質團體比同質團體有較低的效度係數===>因為較高 (C)測驗的內容效度可以由效度係數得知 ====>專家判斷或統計分析 (D)同時效度係數通常比預測效度係數低====>較高 內容效度 指測驗題目對有關內容或行為範圍取樣的適當性。 成就測驗 和熟練測驗特別註重這種效度。例如,在成就測驗中,測驗題目是根據教學大綱和教材內容適當抽出的, 內容效度 就是判斷測驗題目(內容)是否符合它欲測的目標。由於這種衡量效度的方法必須針對課程的目標和內容,以系統的邏輯方法詳細分析題目的性能,故又稱課程效度或邏輯效度。確定內容效度的方法主要有兩種:①專家判斷,即由有關專家對測驗題目與原定內容範圍的符合性作出判斷;②統計分析,即以一組被試在取自同樣內容範圍的兩個獨立測驗上得分的相關作出估計。內容效度很容易與錶面效度相混淆,實際上兩者意義不同。錶面效度指從外表(如測驗的材料及用語、試題的印刷等)直觀地看,測驗題目與測量目標的一致程度,它與內容效度所指測驗在實際測量上的有效程度不同。從技術意義上嚴格地說,表面效度不是效度,但為了取得被試的信任與合作,表面效度也不可忽視。 內容效度(content validity)與表面效度(face validity) 內容效度指衡量工具的內容是否反映出切合研究主題、及能夠涵蓋足夠層面的程度 表面效度是指衡量工具直觀上的有效程度,又稱為一致效度(consensus validity)   效標關聯效度(criterion-related validity) 效標關聯效度又稱為實證或統計效度(empirical or statistical validity),指測量結果和效度標準之間的相關程度 同時效度:指衡量的結果和目前的效度標準的相關程度 預測效度:指衡量的結果和未來的效度標準的相關程度   構念效度(construct validity) 又稱為衡量效度(measure validity),指衡量工具所能衡量到理論概念的程度 聚合效度(convergent validity):指當我們採取多種工具測量同一構念時,這些工具衡量結果之間的相關程度 辨別效度(discriminate validity):某衡量工具如果是為了測度某構念而設計,則其所得衡量結果應該和其他不是為衡量該構念而設計的工具所得的結果沒有太大的相關性  n  表面效度(face validity):這是最容易達成及最基本的效度。此類效度就是由學界來判斷指標是否真的測量到所欲測量到的構念。 n  內容效度(content validity):這是一種特殊的表面效度。此類效度關心的是:是否一個定義的內容都在測量中呈現出來?構念定義包含著想法與概念的「空間」,指標測量應該抽樣到或包含到此空間中所有的想法。內容效度的達成有三個步驟: ─ 說明構念定義的內容 ─ 從此定義所包含的區域或部份中做抽樣 ─ 發展指標將定義來連結定義的這些部份 n 預測效度(predictive validity):一個指標能預測在邏輯上與構念相關的事件。此指標與預測的事件是指向同一構念,但又有區別。這和假設測定不同。假設測定是一個變項預測另一不同的變項。 n 效標關聯效度:指的是用測驗分數與效標之間的相關係數來表示測驗效度的高低。效標的意思是足以顯示測驗想測量的特質之參照標準,例如一項數學測驗,我們可以以學生平時的數學表現作為效標再求學生在數學測驗的分數與其平時表現的相關,相關愈高就表示此數學測驗的效標關聯效度愈高       增益效度(incremental validity)的概念與技術     增益效度(Sechrest, 1963)是指某特定測驗對於準確預測某一效標,在考量其他測量分數對於效標的影響後的貢獻程度。對於某一個測驗分數A,效標為Y變項,增益效度是指A對於Y的解釋是否優於另一個B變項對於Y變項的解釋。如果A變項優於B變項,那麼A變項對於Y變項的解釋,在B變項被考慮的情況下,應仍具有解釋力。例如,如果某項能力測驗(A)果真在反應個體的認知能力,那麼該能力測驗應可以用以解釋學生的學習成果(Y),而且在將努力因素(B)排除之後,能力測驗仍然能夠非常有效的解釋學習成果的話,即可說明能力測驗具有相當程度的增益效度。     Cohen與Cohen(1983)以統計模型說明增益效度的計量原理。若要計算A變項對於Y變項的關聯性,並考慮B變項的影響,公式如下:   【效標關聯效度】Criterion-related validity :使用中的衡量工具和其他的衡量工具來比較兩者是否具有關連。想要預測某事情的結果或估計某種現存的行為或現象。其中還包括預測效度(predictive validity)和同時效度(concurrent validity)。   【建構效度】系指測驗能測量理論的概念或特質之程度而言。此種效度旨在以心理學的理論概念來說明並分析測驗分數的意義,即從心理學的理論觀點,就測驗的結果加以詮釋和探討,亦即根據心理學理論上的構想來編製測驗的內容或選擇試題。所謂「建構」或「構念」,就是心理學理論所涉及之抽象而屬假設性的概念,特質或變項,如智力、焦慮、機械性向、成就動機等。建構效度的主要重點是在於理論上的假設和對理論假設的考驗。在考驗的過程中,必須先從某一建構的理論出發,導出各項關於心理功能或行為的基本假設,據以設計和編製測驗,然後由因求果,以相關實驗和因素分析等方法,,查核測驗結果是否符合心理學中的理論觀點。 構念效度(效標關聯效度)聚斂性證據:若在某一測量工具的得分與測量同一特質的另一種工具的得分呈高度相關區辨性證據:當在某測量工具上的得分與測量不同特質的分數,未呈高度相關  內在結構證據:當各題目間和各部份間的相關性,在實證上與理論或分數預期的用途一致反應過程證據:聚焦於分析、檢查接受測試者對特定任務採取的表現策略或反應,是否與預圖要測量的或解釋                                     的相 一致 http://books.google.com.tw/books?id=uLddv8qIjW4C&pg=PA514&lpg=PA514&dq=%E8%81%9A%E6%96%82%E6%80%A7%E8%AD%89%E6%93%9A&source=bl&ots=mV6sjccLH5&sig=MuoHs_7ZXX9GTbdCej7_o0r8Vas&hl=zh-TW&sa=X&ei=2RhzT4v6Ic7qmAX7-828Dw&ved=0CC8Q6AEwAg#v=onepage&q=%E8%81%9A%E6%96%82%E6%80%A7%E8%AD%89%E6%93%9A&f=false 構念效度(construct validity) 構念效度就是指測驗能夠測量到理論上的構念或特質的程度。易言之,就是指測驗分數能夠依據某種心理學的理論構念加以解釋的程度。 內容效度(content validity) 指測驗內容的代表性或取樣的適切性 該衡量工具能足夠涵蓋主題的程度。從測量工具的內容來檢查,看看是否符合測量目標所預期的內容。 同時效度(concurrent validity) 同時效度是指測驗分數與實施測驗同一時間所取得的效標之間的相關。 想要預測某事情的結果或估計某種現存的行為或現象。以其他測量為標準(習稱效標),將測量結果與效標作一比較,若彼此相關程度愈大,顯示效度愈高,反之亦反。 預測效度(predictive validity) 預測效度是指測驗分數與實施測驗後一段時間所取得的效標之間的相關,旨在使用測驗分數預測個人在效標方面的未來表現。 效標關聯效度(criterion-related validity) 指測驗分數與一些外在效標間的相關,是以經驗性的方法,研究測驗分數與外在效標間的關係,所以又叫經驗效度或統計效度empirical or statistical validity。 根據效標取得時間分 1.同時效度(concurrent validity):效標分數和測驗分數同時取得,目的 使用測驗分數估計個人在效標方面的目前實際表現。 ex新編職業測驗(employment test)-目前工作成績 新編英語成就測驗-在校英語段考成績 2.預測效度(predictive validity):效標分數在測驗實施後一段時間取 得,目的使用測驗分數預測個人在效標方面的未來表現。 ex新編職業測驗-錄取後一段時間後的工作成績,預測效度對於 人員選擇與分類的測驗最為適當。 性向測驗、智力測驗重視預測效度。 效標關聯效度Criterion-related validity :使用中的衡量工具和其他的衡量工具來比較兩者是否具有關連。想要預測某事情的結果或估計某種現存的行為或現象。其中還包括預測效度(predictive validity)和同時效度(concurrent validity)。 #預測效度(predictive validity) 指一個測驗對出於特定情景中的個體的行為進行於預測的有效性,也就是對我們所感興趣的行為能够預測到什麼程度。 #同時效度(concurrent validity) 根據衡量工具與目前某種衡量校標的相關程度,用以衡量本研究衡量工具之有效性。 http://www.1493.com.tw/upfiles/skill01116825951.pdf http://n-explain.blogspot.tw/2005/08/criterion-related-validity.html 效度 內容效度、效標關聯效度、建構效度 內 容 效 度 測驗試題樣本內容是否具有與「教學目標」及「教材內容」的代表現或適切性。依據雙向戲目表進行。適用於成就測驗。 效 標 關 聯 效 度 (又稱實證效度、經驗效度、統計效度) 用實證分析法研究測驗分數與外在效標的關係;探討效度的類推性,即某個情境結論能夠推論或應用其他情境證據;測驗成績對目前或未來某一行為表現預測力高低,可使用「預期表」或「相關係數」進行考驗。依「測驗使用目的」與「外在效標取得時間」的不同,分為兩種:   1.同時效度 測驗分數與外在效標的取得在同一時間內連續完成,用以估計個人在效標方面的實際表現。適用於診斷測驗。 2.預測效度 測驗分數與外在效標的取得相隔一段時間,用以估計個人在效標方面的未來表現。適用於性向、智力測驗。 建 構 效 度 (構 念 效 度) 指測驗能測量理論的概念或特質的程度,也就是測驗分數能夠依據某種心理學理論構念加以解釋的程度,使用心理學的概念來解釋測驗分數的意義即是。包含內容效度與效標關聯效度。   1.內部一致性分析:以測驗總分為內在效標,逐一分析個別試題與總分間的相關係數。 2.外在效度分析:先將理論建構分析後,找出合適的外在效標。 3.因素分析法 4.多項特質─多項方法分析法 Criterion-related validity效標關聯效度   效標關聯效度Criterion-related validity :使用中的衡量工具和其他的衡量工具來比較兩者是否具有關連。想要預測某事情的結果或估計某種現存的行為或現象。其中還包括預測效度 (predictive validity)和同時效度(concurrent validity)。 Criterion related validity, also referred to as instrumental validity, is used to demonstrate the accuracy of a measure or procedure by comparing it with another measure or procedure which has been demonstrated to be valid. For example, imagine a hands-on driving test has been shown to be an accurate test of driving skills. By comparing the scores on the written driving test with the scores from the hands-on driving test, the written test can be validated by using a criterion related strategy in which the hands-on driving test is compared to the written test. #預測效度(predictive validity) 指一個測驗對出於特定情景中的個體的行為進行於預測的有效性,也就是對我們所感興趣的行為能够預測到什麼程度。 #同時效度(concurrent validity) 根據衡量工具與目前某種衡量校標的相關程度,用以衡量本研究衡量工具之有效性。 就是看有沒有預測是老師候選人;會讀教育科目的就是! 本題: 94.下列何種效度對教師甄選測驗最為重要?(混淆選項: (C)建構) Ans: (A) 效標關聯效度  cf 100 中區 33. 如果要設計一套性向測驗來甄選具有專業潛力的國中教師,請問此種測驗最需重視哪一種效度?  (混淆選項: (C)同時) Ans (B)預測效度 sol: 這兩題考的觀念不一樣,要用各種效度的定義去區別最佳選項。 (編修來自摩友朱家麗的整理) (1)內容效度(取樣效度、課程效度、邏輯效度):測驗內容是否符合教材內容與教學目標 ex: 成就測驗 (2)效標關聯效度(實證效度、統計效度):實用性最高的一種效度,含兩種:    同時效度:測驗分數與「當前」實際表現相關係數 ex: 診斷測驗、成就測驗 (如:校內的數學段考)    預測效度:測驗分數與 「一段時間後」實際表現相關係數ex: 性向測驗、(智力測驗) (如:教甄,關鍵字在"潛力") (3)建構(構念)效度:測驗分數能依理論構念加以解釋的程度 ex:人格測驗 建構效度的主要重點是在於理論上的假設和對理論假設的考驗。在考驗的過程中,必須先從某一建構的理論出發,導出各項關於心理功能或行為的基本假設,據以設計和編製測驗,然後由因求果,以相關實驗和因素分析等方法,,查核測驗結果是否符合心理學中的理論觀點。      建構效度最關心的問題是:測量工具(量表)實際測量的是哪些特征?在評價建構效度時,調研人員要試圖解釋“量表為什麼有效”這一理論問題以及考慮從這一理論問題中能得出什麼推論。建構效度要求對每個特征的測量背後有足夠的理論支持,並且這些被測量的特征之間應該有合理的關係。建構效度包括同質效度、異質效度和語意邏輯效度。   同質效度是指量表測量同一特征的其他測量方法相互關聯的程度。異質效度是指量表和測不同特征的測量方法不同但理論上有關特征的測量方法之間相互關聯的程度。在設計量表時,首先建立一個理論模型,然後從中導出一系列推論、測試,逐漸形成一個由幾個特征系統地聯繫起來的語意邏輯網。從錶面上看,就是含有多個有關測量對象測量項目的量表。評價建構效度就是要在這個量表的背景下進行。   補充說明 內容效度:取樣本的角度去看,樣本是不是越多越好,可是太多容易費時,少了就失去代表性,除非你的樣本能代表母群的意義。                  而內容效度是說:樣本代表母群特性的程度如何?  具體說:你大學的班級是個很活潑的班級,可是一定每位學生都很活潑嗎?不一定                  這只是有大部分的人都很活潑,因此我對你們班上抽十位出來,發現只有5個人很活潑,那麼樣本是不是沒代表性,這群樣本的內容效度                  就低了。   建構效度:你們所說的就很ok了~~~ 效標關聯效度 l   以經驗性的方法,研究測驗分數與一些外在效標間的關係,故又可稱為經驗效度或統計效度。 l   如果測驗分數和外在效標的相關愈高,表示測驗愈能有效預測外在效標。 l   外在效標指測驗所要預測的某些行為或量數。學業性向測驗以學校的學業成績作為效標。 l   同時效度與預測效度   構念效度的意義 l   構念效度指測驗能夠測量到理論上的構念或特質的程度。易言之就是指測驗分數能夠依據某種心理學的理論構念加以解釋的程度。因此凡是根據心理學的構念,對測驗分數的意義所做的分析和解試,即為構念效度。 l   構念(construct)是心理學上的一種理論構想或特質,他是觀察不到的,但心理學假設他是存在的,以便解釋一些個人的行為。像智力 性向 動機 焦慮 批判思考 社會性 內向性 或 機械性向等均為心理學上的理論構念或假設性的概念。 l   這些構念都有其心理學上的理論基礎,依據其理論可以預測人類的行為,而提出行為上的假設,然後加以驗證。   影響實驗之內外在效度之因素,說明如下: A.影響實驗之內在效度之因素: (1)同時事件:在實驗期間,受試者所經歷到實驗處理以外的其他事件。而此 可能會影響依變項而干擾實驗結果。 (2)成熟:受試者在實驗期間,生理或心理產生變化。 (3)測驗:前測經驗的影響。 (4)測量的工具:測量工具之不同所產生的影響。 (5)統計迴歸:指受試者的測量分數在第二次測量時,其分數有向團體平均數 迴歸(趨近)的傾向。亦即高分組的受試者在第二次測量時,其分數向平均數 迴歸而有降低的趨勢;而低分組的受試者,其分數確有升高的趨勢。 (6)差異的選擇:採用兩組或多組的實驗研究中,研究者須考慮不同受試者的 特質,否則易產生偏差。 (7)因素間的交互作用:上述因素間的交互作用。   B.影響實驗之外在效度的因素: (1)測驗的反作用或交互作用效果:前測的經驗會限制研究結果的推論性,有 前測的實驗結果只能推測到有前測的情境,不適用其他情境。 (2)選擇偏差與實驗變項的交互作用效果:研究者選取具有獨特心理特質的受 試者做實驗時,這個交互作用效果易於產生。而此種研究結果不適用沒有具備這 些特質的受試者。 (3)實驗安排的反作用效果:即「霍桑效應」,為參加實驗的受試者,覺查到他 們正在接受一項實驗研究,而投實驗者所好,改變其正常之表現。 (4)多重實驗處理的干擾:當同樣的受試者重複接受兩種或多種的實驗處理,由 於前面的處理不易完全消失,以致實驗處理間會產生干擾的作用。 影響外在效度的因素: 1.    施測的反作用效果:指採用前後測設計時,實驗的結果僅能推論至有前測的情境,而無法概括無前測的情境。 2.    霍桑效應:實驗時,受試者知道自己正在參加實驗、正在被觀察,則足以使他表現得與平常非實驗情境不一樣,此種實驗安排的反作用效果,即稱為霍桑效應,其會影響實驗研究的外在效度,使結論的推論有困難。 3.    選擇與實驗變項的交互作用:「實驗變項」本身的性質如何便足以使受試者選擇產生偏頗,如進行有關特殊教育方面的實驗,便容易在對特書教育方面有興趣的校長所服務的學校找到學生參加實驗,而用這樣偏頗的受試樣本實驗出來的結果,不一定能適用於其他學校。 4.    重複實驗處理的干擾:同一組受試者重複揪受不同處理時,雖可增加實驗內在效度,但其外在效度卻可能反而降低,亦即此種重複處理的實驗結論較無法推論到非重複處理的情境。 構念效度(construct validity) 構念效度就是指測驗能夠測量到理論上的構念或特質的程度。易言之,就是指測驗分數能夠依據某種心理學的理論構念加以解釋的程度。 內容效度(content validity) 指測驗內容的代表性或取樣的適切性 該衡量工具能足夠涵蓋主題的程度。從測量工具的內容來檢查,看看是否符合測量目標所預期的內容。 同時效度(concurrent validity) 同時效度是指測驗分數與實施測驗同一時間所取得的效標之間的相關。 想要預測某事情的結果或估計某種現存的行為或現象。以其他測量為標準(習稱效標),將測量結果與效標作一比較,若彼此相關程度愈大,顯示效度愈高,反之亦反。 預測效度(predictive validity) 預測效度是指測驗分數與實施測驗後一段時間所取得的效標之間的相關,旨在使用測驗分數預測個人在效標方面的未來表現。 X 構念效度(construct validity) 構念效度就是指測驗能夠測量到理論上的構念或特質的程度。易言之,就是指測驗分數能夠依據某種心理學的理論構念加以解釋的程度。 內容效度(content validity) 指測驗內容的代表性或取樣的適切性 該衡量工具能足夠涵蓋主題的程度。從測量工具的內容來檢查,看看是否符合測量目標所預期的內容。 同時效度(concurrent validity) 同時效度是指測驗分數與實施測驗同一時間所取得的效標之間的相關。 想要預測某事情的結果或估計某種現存的行為或現象。以其他測量為標準(習稱效標),將測量結果與效標作一比較,若彼此相關程度愈大,顯示效度愈高,反之亦反。 預測效度(predictive validity) 預測效度是指測驗分數與實施測驗後一段時間所取得的效標之間的相關,旨在使用測驗分數預測個人在效標方面的未來表現。 構念效度(construct validity) 構念效度就是指測驗能夠測量到理論上的構念或特質的程度。易言之,就是指測驗分數能夠依據某種心理學的理論構念加以解釋的程度。 內容效度(content validity) 指測驗內容的代表性或取樣的適切性 該衡量工具能足夠涵蓋主題的程度。從測量工具的內容來檢查,看看是否符合測量目標所預期的內容。 同時效度(concurrent validity) 同時效度是指測驗分數與實施測驗同一時間所取得的效標之間的相關。 想要預測某事情的結果或估計某種現存的行為或現象。以其他測量為標準(習稱效標),將測量結果與效標作一比較,若彼此相關程度愈大,顯示效度愈高,反之亦反。 預測效度(predictive validity) 預測效度是指測驗分數與實施測驗後一段時間所取得的效標之間的相關,旨在使用測驗分數預測個人在效標方面的未來表現。 謝謝樓上的解答!綜合一下之前看到的! 影響內在效度:研究設計正確地說明研究結果的程度,或是呈現自變項和依變項之因果關係的程度。如: 1.自我選擇(Selection,在單次調查中更容易存在) 2.成熟(Maturation) 3.自我選擇和成熟的交互影響(Selection-Maturation Interaction) 4.歷史(History,在重覆實驗或調查中均存在) 5.重覆測試(Repeated Testing,固定樣本調查有此問題) 6.測試工具影響(Instrumentation,調查問卷自然有其問題) 7.統計回歸趨中(Regression to the Mean,調查同樣存在、追蹤調查尤其如此) 8.實驗對象流失(Experimental Mortality、同樣適用於固定樣本) 9.實驗偏差(Experimenter Bias,在調查中也有調查環境的問題) 10.強亨利 11.臨時事故 12.補償性均等(錢或勞力) 13.選樣不等 14.實驗擴散 15.實驗者偏見 16.統計結論錯誤 影響外在效度:研究結果普遍推論到母群或相似情境的程度。如: (一)推論至母群體1.樣本代表性2.可接近母群或標的母群3.心理學變項和供應交互。 (二)推論至情境1.描述研究運作和實驗的情境2.多重處理的干擾3.霍桑效應4.新奇性或破壞效應5.實驗者效應6.前後測的敏感性7.依變項的測試8.時間與處理的交互作用 .內容效度(取樣效度、課程效度、邏輯效度):測驗內容是否符合教材內容與教學目標 ※內容效度適合成就測驗                                                                  ex.雙向細目表:教學目標 ※書局選購測驗卷作為學生的練習作業,應重視內容效度                                                              ※編製測驗或問卷時,邀請學者專家評鑑題目是否合適,是為了提高內容效度                     1.同時效度的效標資料是與測驗分數同時搜集的。例如大學入學考試可以用中學成績作效標。同時效度常用的效標是在校的學業成績、教師的等級評定、臨床檢查等。 2.內容效度指測驗題目對有關內容或行為範圍取樣的適當性。成就測驗和熟練測驗特別註重這種效度。例如,在成就測驗中,測驗題目是根據教學大綱和教材內容適當抽出的,內容效度就是判斷測驗題目(內容)是否符合它欲測的目標。由於這種衡量效度的方法必須針對課程的目標和內容,以系統的邏輯方法詳細分析題目的性能,故又稱課程效度或邏輯效度。 3.建構效度系指測驗能測量理論的概念或特質之程度而言。此種效度旨在以心理學的理論概念來說明並分析測驗分數的意義,即從心理學的理論觀點,就測驗的結果加以詮釋和探討,亦即根據心理學理論上的構想來編製測驗的內容或選擇試題。 4.效標效度,就是考查測驗分數與效標的關係,看測驗對我們感興趣的行為預測得如何。因為效標效度需要有實際證據,所以又叫實證效度。 所謂效標效度,就是考查測驗分數與效標的關係,看測驗對我們感興趣的行為預測得如何。因為效標效度需要有實際證據,所以又叫實證效度。  (一)預測效度與同時效度   根據搜集效標的時間,可以將效標效度分為預測效度和同時效度。   1.同時效度同時效度的效標資料是與測驗分數同時搜集的。例如大學入學考試可以用中學成績作效標。同時效度常用的效標是在校的學業成績、教師的等級評定、臨床檢查等。   2.預測效度   預測效度的效標資料需要過一段時間才可搜集到。此種效度對人員的選拔和安置工作非常重要。常用的效標是專業訓練的成績、實際工作的表現等。 影響內在效度:研究設計正確地說明研究結果的程度,或是呈現自變項和依變項之因果關係的程度。   如1.自我選擇(Selection,在單次調查中更容易存在);2.歷史(History,在重覆實驗或調查中均存在);3.成熟(Maturation)4.重覆測試(Repeated Testing,固定樣本調查有此問題)5.測試工具影響(Instrumentation,調查問卷自然有其問題)6.統計回歸趨中(Regression to the Mean,調查同樣存在、追蹤調查尤其如此)7.實驗對象流失(Experimental Mortality、同樣適用於固定樣本)8.自我選擇和成熟的交互影響(Selection-Maturation Interaction9.實驗偏差(Experimenter Bias,在調查中也有調查環境的問題)10.強亨利11.臨時事故12.補償性均等(錢或勞力)13.選樣不等14.實驗擴散15.實驗者偏見16.統計結論錯誤 影響外在效度:研究結果普遍推論到母群或相似情境的程度。   如(一)(推論至)母群體1.樣本代表性2.可接近母群或標的母群3.心理學變項和供應交互。(二)1.描述研究運作和實驗的情境2.多重處理的干擾3.霍桑效應4.新奇性或破壞效應5.實驗者效應6.前後測的敏感性7.依變項的測試8.時間與處理的交互作用 內容效度:測驗所選取的試題樣本,能適切測量到所欲測量的行為或特質之程度。                     試題樣本越具「代表性」則內容效度越佳。                     檢驗方式-雙向細目表、內容效度比率(CVR) 效標關聯效度:關注測驗的內涵和檢驗方式。 EX:學生未來的學業成就、員工未來的工作績效是施測者關心的結果,此即為效標 效標關聯效度可分為兩種 同時效度與預測效度。 簡單說同時效度就是測驗分數與效標是同時得到的。EX:老師想藉由平常考得知學生現在的學習狀況。 預測效度是當測驗分數和效標之間存在著時距,欲以測驗結果「預估」將來表現。EX:考官預測參加推薦甄選的學生未來入學後學業表現的程度,當考上的學生學業表現越好,表示預測效度越高。 檢驗方式:積差相關 檢驗重點:慎選「效標」 建構效度:測驗能將心理特質透過行為的表現或測驗的方式測量而出的值。EX:智力                     由於對於心理特質所做測驗的結果是一種假設性的推估值,故測驗結果並不能完全代表該心理特質的狀     態。EX:智力測驗得到80分的人並不能完全代表其真實智力為80分 檢驗方式:由於建構效度是「將虛擬實」的一種指標,不能以單一方式進行檢驗,必須用多種方式進行檢驗。EX:因素分析...... 最後...有人可以告訴我表面效度是啥東東嗎?感覺好像沒有這東西 以上資料來源:《教育測驗與評量》涂金堂,三民 第七章 效度   影響內在效度的因素 1.成熟(發生於較長時間的實驗) 2.選樣的差異 3.歷史事件(突發事件) 4.受試者亡佚(中途退出)--->偏差樣本 5.選樣與成熟的交互作用 6.測量工具的變化 7.測驗(測試經驗) 8.統計迴歸效應---->發生於(1)採極端選樣                                       (2)採前後測實驗設計 9.強亨利效應 10.怨恨性怠工 11.補償性均等(對控制組)---->白藥劑效應 12.實驗處理的擴散 13.統計分析 14.實驗者偏見 效度 所謂效度是指使用的測量工具(EX:考卷)能否指出研究者所欲瞭解的特質。 評估效度的高低程度有 架構效度(Constract Validity )、內容效度(Content Validity)、準確效度(Criterion-Related Validity)。  架構效度: 此指衡量工具所能衡量到理論概念的程度,也就是說若將衡量工具所得的結果中之二組或多組題型相結合,而二者間有某種預期的相關關係存在時,就表示此衡量工具具有某種程度的架構效度。     內容效度 :指衡量工具的內容是否反映出切合研究主題的程度。為了建立內容效度,研究者必須蒐集所有相關的問題與變數,並從中選擇能夠完整涵蓋所界定的研究範圍的問題,如此才能具備充分的內容效度(才能衡量出國一時所學習的能力)。  準確效度 此指測量結果和效度標準之間的相關程度,可分為預測效度(Predictive)及同時效度(Concurrent validity),例如從一項汽車消費者的購買行為調查中發現,調查結果與目前市場的品牌市佔率有相當的關連性(表示具有同時效度),亦與未來消費者會購買哪一種品牌有顯著的相關(表示具有預測效度)時,顯示此一調查問卷具有相當高的準確效度。   影響內在效度: 1.差異選擇、選樣不等:抽樣偏差(ex自願者.非隨機抽樣) 2.歷史:研究期間發生的事(=同時事件=臨時事故) 3.成熟:受試身心的改變;或內在隨時間改變(ex疲勞) 4.重覆測試:前測的影響,敏感與練習 5.測試工具影響:前後測的難易與內容、不同人員、不同情況 6.統計迴歸趨中:極端選樣,極端分數會有向平均數迴歸的現象(天花板/地板效應) 7.實驗對象流失:死亡、缺席退出,導致前後測人數不同 8.選樣和成熟的交互作用 9.實驗者偏見 10.補償性競爭:(強亨利效應)補償性對抗,控制組不甘示弱 11.補償性均等:提供控制組其他資源(ex錢或勞力)上的補償 12.實驗處理的擴散:控制組也從事實驗組活動 13.統計結論錯誤 影響外在效度:研究結果普遍推論到母群或相似情境的程度。 (一)母群效度 1.取樣限制(可得母群體與標的母群體不同) 2.取樣偏差(研究對象特殊) (二)生態效度 1.變項與情境敘述不清 2.多重處理的干擾 3.霍桑效應(實驗效應)(也可是內在效度) 4.新奇性或破壞效應(也可是內在效度的威脅) 5.實驗者效應 6.前後測的敏感性 7.依變項的測試 8.測驗時間與處理的交互作用   影響外在效度的因素:   施測的反作用效果: 指採用前後測設計時,實驗的結果僅能推論至有前測的情境,而無法概括無前測的情境。   霍桑效應: 實驗時,受試者知道自己正在參加實驗、正在被觀察,則足以使他表現得與平常非實驗情境不一樣,此種實驗安排的反作用效果,即稱為霍桑效應,其會影響實驗研究的外在效度,使結論的推論有困難。   選擇與實驗變項的交互作用: 「實驗變項」本身的性質如何便足以使受試者選擇產生偏頗,如進行有關特殊教育方面的實驗,便容易在對特書教育方面有興趣的校長所服務的學校找到學生參加實驗,而用這樣偏頗的受試樣本實驗出來的結果,不一定能適用於其他學校。   重複實驗處理的干擾: 同一組受試者重複揪受不同處理時,雖可增加實驗內在效度,但其外在效度卻可能反而降低,亦即此種重複處理的實驗結論較無法推論到非重複處理的情境。 影響內在效度的因素: 1.    成熟:受試者在實驗期間,不論生理或心理均會產生變化,而可能影響實驗的結果;所以實驗結果的差異,到底是個體變項造成,亦或實驗處理造成,將混淆不清。 2.    臨時事故(同時事件):在實驗期間,受試者從實驗情境內外,經驗到一些實驗處理以外的特定事件,而影響到實驗的結果。 3.    測驗:實施前後測的實驗設計,測試會影響到受試者,使得個人變得敏感些,或了解研究者所隱藏的目標,或對測驗的表現較為熟練,致使後測成績優於前測,而其結果是因測試的經驗造成或實驗處理造成的不易解釋清楚。 4.    測量工具的變化:後測時所用的測驗器材或評分人員與前測不同,例如測驗卷被寫了答案,評分人員變得較粗心、較不嚴格等,都可能使後測成績發生改變,但卻無法完全歸因於實驗處理。 5.    統計迴歸現象:實驗受試者如為極端選樣,則後測的分數會產生趨近平均數的迴歸現象,而影響實驗的結果。 6.    選樣誤差:指實驗組與控制組的受試者並不相等,尤以選用自願者或整個班級時,可能會發生此種情形。 7.    受試者亡佚:在實驗期間,受試者因為死亡或退出,會使得實驗組或控制組的樣本變成偏差樣本,而影響實驗結果的內在效度。 8.    選樣與成熟交互作用:指實驗組與控制組的樣本不相等再加上成熟因素所造成的影響。 9.    強亨利效應:在實驗期間,控制組的受試者為了不甘示弱,力圖與實驗組一較長短而有一般水準以上的表現,此一現象即稱為強亨利效應,其會影響實驗結果的精確性。 10.實驗的處理擴散:若實驗的條件與控制的條件具有很密切的關係或受試者彼此很親近,則控制組的成員可能尋求接觸處理條件的機會,實驗的處理擴散,就很容易會發生。 11.實驗者偏見:指實驗者精心設計或無意處理,而對受試者產生的影響,如實驗者對於受試者地位的認知,可能影響實驗者作客觀的判斷。 12.統計的結論:指統計的使用若違背其原理,或誤用統計考驗,則無法獲得有效的結果,而影響實驗結果的內在效度。 影響內在效度的因素: 1.    成熟:受試者在實驗期間,不論生理或心理均會產生變化,而可能影響實驗的結果;所以實驗結果的差異,到底是個體變項造成,亦或實驗處理造成,將混淆不清。 2.    臨時事故(同時事件):在實驗期間,受試者從實驗情境內外,經驗到一些實驗處理以外的特定事件,而影響到實驗的結果。 3.    測驗:實施前後測的實驗設計,測試會影響到受試者,使得個人變得敏感些,或了解研究者所隱藏的目標,或對測驗的表現較為熟練,致使後測成績優於前測,而其結果是因測試的經驗造成或實驗處理造成的不易解釋清楚。 4.    測量工具的變化:後測時所用的測驗器材或評分人員與前測不同,例如測驗卷被寫了答案,評分人員變得較粗心、較不嚴格等,都可能使後測成績發生改變,但卻無法完全歸因於實驗處理。 5.    統計迴歸現象:實驗受試者如為極端選樣,則後測的分數會產生趨近平均數的迴歸現象,而影響實驗的結果。 6.    選樣誤差:指實驗組與控制組的受試者並不相等,尤以選用自願者或整個班級時,可能會發生此種情形。 7.    受試者亡佚:在實驗期間,受試者因為死亡或退出,會使得實驗組或控制組的樣本變成偏差樣本,而影響實驗結果的內在效度。 8.    選樣與成熟交互作用:指實驗組與控制組的樣本不相等再加上成熟因素所造成的影響。 9.    強亨利效應:在實驗期間,控制組的受試者為了不甘示弱,力圖與實驗組一較長短而有一般水準以上的表現,此一現象即稱為強亨利效應,其會影響實驗結果的精確性。 10.實驗的處理擴散:若實驗的條件與控制的條件具有很密切的關係或受試者彼此很親近,則控制組的成員可能尋求接觸處理條件的機會,實驗的處理擴散,就很容易會發生。 11.實驗者偏見:指實驗者精心設計或無意處理,而對受試者產生的影響,如實驗者對於受試者地位的認知,可能影響實驗者作客觀的判斷。 12.統計的結論:指統計的使用若違背其原理,或誤用統計考驗,則無法獲得有效的結果,而影響實驗結果的內在效度。

想要觀看完整全文,請先登入


關鍵字:內容效度同時效度構念效度預測效度效度