6. 資料科學團隊在模型訓練前,需對數值特徵進行正規化(Normalization)或標準化(Standardization)。為確保模型評估結果具真實性並避免資料洩漏(Data Leakage),下列何者為最適當的作法?
(A)於資料分割前,先對完整資料集計算統計量並進行標準化處理;
(B)先分割訓練資料(Training Data)和測試資料(Test Data),並各自獨立計算 統計量後進行標準化;
(C)先分割訓練資料(Training Data)和測試資料(Test Data),僅以訓練資料計算 統計量,再套用至測試資料;
(D)僅對訓練資料(Training Data)進行標準化處理,測試資料(Test Data)保持原 始數值
答案:登入後查看
統計: A(0), B(1), C(1), D(0), E(0) #3870510
統計: A(0), B(1), C(1), D(0), E(0) #3870510