關於「信度與效度」的考題
在課程與教學108-2申論第三題,和108-1申論第四題都有考到

1.信度
(1)增加同質性題目。
(2)刪除過於簡單或困難的題目,增加"難易適中"的試題。
2.效度
(1)題目異質多元。
(2)列出雙向細目表,將試題的範圍及目標寫在表上。
**信度是指測驗結果的一致性與穩定性。**也就是說,同一個人多次測驗(或類似情境下測驗)應有相似的結果。
增加題目數量
題目數越多,測驗結果越穩定(根據信度理論中的「斯皮爾曼–布朗預測公式」)。
但要避免讓受試者疲憊,影響作答品質。
統一測驗程序
確保施測環境、時間、指導語、監考方式一致,降低外在變因干擾。
使用客觀題型
如選擇題或配對題,能減少評分主觀性。
加強評分標準的一致性
若有主觀題(如申論題),應設計清楚的評分規準(rubric),並進行評分者訓練與校準(inter-rater reliability)。
分析與修正不良試題
使用試題分析(如 KR-20、Cronbach’s α、難度與鑑別度)來剔除或修正表現不穩定的試題。
效度是指測驗是否真正測量了它所要測量的構念。
內容效度(Content Validity)
確保測驗涵蓋所測能力的所有面向。
透過專家審查試題,確認題目是否符合教學目標或課綱標準。
建構效度(Construct Validity)
使用理論基礎建構題目,例如要測「批判思考能力」,題目需能呈現此心理特質。
使用因素分析、專家驗證等方式檢驗測驗構面。
效標關聯效度(Criterion-related Validity)
測驗結果與外部標準(如學期成績、能力檢定等)相關性高。
可分為:
同時效度(Concurrent):與現有標準比較。
預測效度(Predictive):是否能預測未來表現。
表面效度(Face Validity)
雖非真正的統計效度類型,但如果受試者認為題目「看起來合理」,作答動機會較高。
(by chatGPT)
**信度是指測驗結果的一致性與穩定性。**也就是說,同一個人多次測驗(或類似情境下測驗)應有相似的結果。
增加題目數量
題目數越多,測驗結果越穩定(根據信度理論中的「斯皮爾曼–布朗預測公式」)。
但要避免讓受試者疲憊,影響作答品質。
統一測驗程序
確保施測環境、時間、指導語、監考方式一致,降低外在變因干擾。
使用客觀題型
如選擇題或配對題,能減少評分主觀性。
加強評分標準的一致性
若有主觀題(如申論題),應設計清楚的評分規準(rubric),並進行評分者訓練與校準(inter-rater reliability)。
分析與修正不良試題
使用試題分析(如 KR-20、Cronbach’s α、難度與鑑別度)來剔除或修正表現不穩定的試題。
效度是指測驗是否真正測量了它所要測量的構念。
內容效度(Content Validity)
確保測驗涵蓋所測能力的所有面向。
透過專家審查試題,確認題目是否符合教學目標或課綱標準。
建構效度(Construct Validity)
使用理論基礎建構題目,例如要測「批判思考能力」,題目需能呈現此心理特質。
使用因素分析、專家驗證等方式檢驗測驗構面。
效標關聯效度(Criterion-related Validity)
測驗結果與外部標準(如學期成績、能力檢定等)相關性高。
可分為:
同時效度(Concurrent):與現有標準比較。
預測效度(Predictive):是否能預測未來表現。
表面效度(Face Validity)
雖非真正的統計效度類型,但如果受試者認為題目「看起來合理」,作答動機會較高。
(by chatGPT)