17. 某電商公司欲利用顧客行為資料建立消費預測模型,其中「會員等級」欄位包含「一般、白金、黑卡」三種類別。若模型採用梯度提升樹 (Gradient Boosting Tree)演算法,資料科學家在進行特徵編碼時應特 別注意下列何種情況?
(A)應優先採用獨熱編碼(One-Hot Encoding),以減少類別之間的相依性與記憶體使用量;
(B)直接使用標籤編碼(Label Encoding)可能使模型誤判類別間存在順序關係,導致特徵重要性偏誤;
(C)使用目標編碼(Target Encoding)會自動消除過擬合 (Overfitting)風險;
(D)若類別數量較少,建議先使用主成分分析(Principal Component Analysis, PCA)進行降維
答案:登入後查看
統計: A(0), B(1), C(1), D(0), E(0) #3773820
統計: A(0), B(1), C(1), D(0), E(0) #3773820