題組內容

二、假設某一個判斷是否為詐騙電子郵件的模型,在全部 10000 筆資料中, 「True Positive 真的為詐騙、且模型判斷為詐騙」有 TP 筆、「False Negative 真的為詐騙、但模型判斷為沒有詐騙」有 FN 筆、 「False Positive 不是詐騙、但模型判斷為詐騙」有 FP 筆、 「True Negative 不是詐騙、且 模型也判斷不是詐騙」有 TN 筆,其數值各如下:

(三)在警檢調、司法做資料探勘,不能只依賴「準確率」 、「精確率」 、 「召 回率」、 「特異度」中單一指標,否則可能因樣本分布、探勘門檻設定 等造成模型整體效力其實不佳的狀況。請假設四個情境來分別說明若 只看該單一指標的問題。(12 分)