37. 若開發一個用於罕見疾病自動診斷的分類模型,目前資料集中確診樣本僅 佔不到 1%,且因為標註成本高,短期內無法取得更多資料。在此情況 下,若希望提升模型對少數類的偵測能力,同時避免過擬合,下列哪一種策略最為合理?
(A)對少數類進行隨機過採樣(Random Oversampling);
(B)對多數類進行欠採樣(Random Undersampling);
(C)使用 SMOTE(Synthetic Minority Over-sampling Technique)生成 合成少數類樣本後再訓練分類模型;
(D)僅使用現有資料調整模型決策閾值(Decision Threshold)以提升召 回率
答案:登入後查看
統計: A(0), B(0), C(1), D(1), E(0) #3773840
統計: A(0), B(0), C(1), D(1), E(0) #3773840