三、以下是一個典型的混淆矩陣(Confusion Matrix)
(一)若將其應用於資訊檢索系統之成效評估時,試闡述其中的 TP、FP、 FN、TN 所代表之意涵。(20 分)
在資訊檢索系統中,評估的核心在於「系統檢索出的文件」與「讀者實際需要的相關文件」之間的吻合程度。對應混淆矩陣的意涵如下:
TP (True Positive,真陽性): 代表**「檢索出且相關」**的文件。即系統判定該文件與查詢相關並將其取出,而該文件實際上也確實是讀者需要的相關文件。
FP (False Positive,偽陽性): 代表**「檢索出但不相關」**的文件(又稱「誤報」)。系統判定為相關並取出,但實際上對讀者而言是不相關的雜訊。
FN (False Negative,偽陰性): 代表**「未檢索出但相關」**的文件(又稱「漏報」)。該文件實際上與讀者需求相關,但系統卻判定為不相關而未將其檢索出來。
TN (True Negative,真陰性): 代表**「未檢索出且不相關」**的文件。系統正確地判定這些文件與讀者查詢無關,因此未將其檢索出來。在大型資料庫中,TN 的數量通常極為龐大。