13. 某行銷公司欲針對新客戶進行「行銷活動推播」,目前擁有資料包含:客 戶基本資料(尚未有購買紀錄)、客戶過往點擊行為(未標記是否完成購 買)、類似客戶是否曾購買過(已標記「有/無購買」標籤)。若該公司希 望預測新的單一客戶是否可能完成購買行為,下列哪一種學習方式與資 料搭配最合適?
(A) 使用非監督式學習,分析所有客戶點擊路徑進行異常偵測
(B) 使用非監督式學習,將客戶分群後預測其轉換率
(C) 使用監督式學習,針對未標記資料直接預測轉換可能性
(D) 使用監督式學習,以已知購買結果作為標籤進行訓練
統計: A(25), B(102), C(64), D(280), E(0) #3645683
詳解 (共 6 筆)
這題的正確答案是 (D) 使用監督式學習,以已知購買結果作為標籤進行訓練。
這是一個典型的二元分類問題(Binary Classification):目標是預測「會購買」或「不會購買」。
為什麼 (D) 是最合適的?
要達成「預測單一客戶是否完成購買」的目標,模型需要知道「什麼樣的特徵(行為、背景)」會導致「購買」這個結果。
-
監督式學習的必要性:題目提到公司擁有「類似客戶是否曾購買過(已標記『有/無購買』標籤)」的資料。這些「標籤」就是監督式學習中的標準答案。
1. 核心考點:監督式學習 (Supervised Learning) 的標籤應用
這題的核心在於判斷現有資源中是否有「答案」可以讓 AI 學習。
-
標籤 (Label):指我們想要預測的目標答案(在此題中為「是否完成購買」)。
-
關鍵線索:題目提到擁有「類似客戶是否曾購買過」的已標記標籤。
2. 逐項解析
-
✅ (D) 使用監督式學習,以已知購買結果作為標籤進行訓練:
-
原因:這是最有效且標準的做法。既然手頭上有「以前的人買不買」的答案(標籤),我們就應該利用這些標籤來訓練模型,讓模型學會哪些特徵(如點擊行為、基本資料)會導致「購買」的結果。訓練好後,再拿來預測新客戶。
-
-
❌ (A) 使用非監督式學習...進行異常偵測:
-
原因:異常偵測(Anomaly Detection)是為了抓出「不尋常」的資料(如信用卡盜刷、機器故障)。行銷目的是預測「常態的購買行為」,並非找怪胎,因此不適用。
-
-
❌ (B) 使用非監督式學習,將客戶分群後預測其轉換率:
-
原因:分群(Clustering)屬於非監督式學習,通常用於「探索性分析」。雖然分群後可以算出該群的平均轉換率,但其預測單一客戶「會不會買」的精準度遠低於直接針對標籤訓練的分類模型。
-
-
❌ (C) 使用監督式學習,針對未標記資料直接預測轉換可能性:
-
原因:敘述邏輯有誤。監督式學習不能在「未標記」的資料上進行「訓練」。必須先在「有標記」的資料上練好功,才能去預測沒標記的資料。
-
? 重點整理:考試判斷金律
-
有標籤 (Labeled) / 有已知結果 $\rightarrow$ 必選 監督式學習(分類或迴歸)。
-
無標籤 (Unlabeled) / 純粹找規律或分群 $\rightarrow$ 必選 非監督式學習(分群或降維)。