對於從各式各樣的測驗所得到的分數,要進行解釋時,隨著測驗的功能與特性,一般有兩種不同的解釋方式:常模參照(norm-referenced)以及標準參照(criterion-referenced)。如果我們解釋個別學生的測驗分數,是拿他的分數來和全體學生的分數作比較,則這種解釋測驗分數的方式便稱為「常模參照」。這是一種以「相對性比較」的觀點,來看待個別學生的測驗結果。段考成績排名、心理測驗原始分數轉換成標準分數或是百分等級(percentile rank, PR)等,都是利用常模參照的方式來解釋分數。
另一方面,如果我們解釋個別學生的測驗分數是以描述他在某一個界定清楚的領域上重要工作表現有多好,或是他的表現以達到什麼樣的優良程度等術語來表示時,這種測驗分數的解釋方式便稱為「標準參照」。這種分數解釋的方式基本上是採用「絕對比較」的觀點來看待個別學生的測驗結果。一般來說,醫師執照、會計師、建築師、律師等證照考試,或是汽車駕駛執照考試等等,都不需要注意排名或是與別人的分數進行比較,需要的只是與某一個標準來進行比較,若考生的分數已經高過那個標準,那麼即可發給證書或是給駕照。
以基本學力測驗來說,最早在提出以基本學力測驗取代傳統的高中聯考時,大家一聽到「基本學力」四個字時,都會以為基本學力測驗的功能應該是測學生的學力是否已達到「基本」的水準,似乎這個測驗是用來作為「門檻」的。果真如此的話,那麼學力測驗分數的解釋方式將會是屬於標準參照的,因為關心的將是某個考生的分數是否高過門檻,而不是該生的分數是排在團體當中的哪一個位置。
因為要減輕學生考試的負擔,因此教育部不准各個招生區或是學校加考其他的學科紙筆測驗﹔甚至在多元入學方案中,對於選擇以「登記分發」來入學者,只根據其基本學力測驗的分數來分發。所以,考生必須在基本學力測驗取得高分,否則不可能「擊敗」眾人以進入前幾個志願的學校就讀。因為如此,此刻對於基本學力測驗分數的解釋,是屬於常模參照的,因此在測驗分數通知單上列有百分等級。百分等級是個用來進行常模參照解釋時,最方便的衍生分數(derived score)。
自從教育部宣布國中基測要加考「國文作文」之後,該如何考或是計分,就一直是個熱門議題。目前教育部初步將作文定位於「門檻」的角色,並且不列入總分的計算,果真如此,作文這一項分數將是屬於標準參照的解釋方式;至於「門檻」將如何決定才算是合理,也就是在 0~5 分或是 1~6 的計分方式中,考生必須達到幾分以上才算「通過」?才算具備最起碼的寫作能力呢?在測驗學界中,訂定合理門檻標準的方法或是程序,稱之為「標準設定」(standard setting)。這個部分過去三十年來在美國測驗界已經累積有許多不錯的經驗和方法
1.效標參照測驗所使用的試題通常會比常模參照測驗所使用者容易些,因為教師多半期望大多數的學生在測驗上都有良好的表現,獲得好成績,教師若仍沿用常模參照測驗的試題分析方法,則高分組與低分組學生在試題上的答對百分比值都會接近1,而鑑別度指標值趨近於0。由此可見效標參照的試題分析方法異於常模參照使用的試題分析分法,方能避免試題分析產生無法解釋的效果
2.標準參照測驗(criterion-referenced test),又稱效標參照測驗,意指評量學生結果,係依據教學目標事先設定絕對的通過標準加以解釋測驗。
標準參照測驗,是以事先設定的標準為基礎,強調個人能夠與不能夠完成之項目,判定其「及格或不及格」、「精熟或不精熟」、「通過或不通過」,不用參考他人表現來比較,具有檢定的功能。在學校教師所進行的隨堂測驗或平時考試,旨在了解學生學習結果精熟與否,可說屬於一種標準參照測驗;此外,一般人參加汽(機)車駕照考試、學力鑑定考試或專業證照考試,都是事先設定標準,根據應考者的表現,通過標準者才發給及格或通過證書。因此,標準參照測驗,是屬於自我比較,而不是與他人進行比較。
標準參照測驗與常模參照測驗(norm-referenced test)都與評量學習成就領域有關,具有甄別學生學習表現之目的,但就其內涵而言則不太相同,前者是事先設定標準進行解釋,後者則是根據分數在團體中位置而加以解釋;此外,就其用途來看亦有所差異,前者在於檢定,屬於診斷性評量,通過者給予證明、不及格者進行補救教學;後者在於鑑別分出高低,屬於總結性評量,分數比他人高者,可優先錄取或進用,如大學聯考、國家高普考試等,均屬於常模參照測驗。
標準參照測驗強調個人的測驗表現是否達到事先所設定標準,而常模參照測驗則是注重個人與團體內其他人員的比較,了解個人在團體中表現的優劣程度。歷年來所舉辦的國中基本學力測驗,測驗結果是以「量尺分數」表示,可歸類為常模參照測驗;而 103 年首度舉辦的國中教育會考,旨在針對國中生畢業前學力的評估與監控,每一科目的成績分為「精熟」、「基礎」、「待加強」3 個表現標準的等級,則屬於標準參照測驗。標準參照測驗已經在評量上廣為使用,對評估學習者學習或工作表現,具有一定教育價值,尤其它所強調學習結果的自我比較,而不是與他人比較,有助於學習者自我了解和自我改進,並可減少同儕激烈競爭及其所造成的壓力,確實有其評量上的效益。