140. 特徵工程中的特徵選擇方法包括以下哪一項?
(A) 使用 PCA 提取信息
(B) 使用信息增益方法選擇重要 特徵
(C) 根據時間序列生成新特徵
(D) 類別型數據編碼
答案:登入後查看
統計: A(227), B(412), C(37), D(44), E(0) #3416415
統計: A(227), B(412), C(37), D(44), E(0) #3416415
詳解 (共 1 筆)
#6557625
正確答案是:(B) 使用資訊增益方法選擇重要特徵
✅ 解釋:
特徵選擇(Feature Selection)是特徵工程中的一個關鍵步驟,目的是從原始特徵中挑出對模型有幫助的特徵,排除不重要或干擾的特徵,以提升模型效能、降低維度與過擬合風險。
各選項解析:
✅ (B) 使用資訊增益方法選擇重要特徵
-
正確,資訊增益(Information Gain)是特徵選擇中**常用的過濾法(filter method)**之一,尤其在分類問題(像是決策樹)中非常常見。
-
它衡量特徵對目標變數的不確定性減少程度,是一種有效的評估方式。
其他選項為錯誤或混淆概念:
(A) 使用 PCA 提取信息
-
❌ 錯誤。PCA 是**特徵萃取(Feature Extraction)**方法,不是特徵選擇。
-
特徵選擇是從原始特徵中挑選一部分;
而特徵萃取是用原始特徵組合出新的特徵。
(C) 根據時間序列生成新特徵
-
❌ 錯誤。這是特徵建構(Feature Construction),例如加入「前一天值」、「移動平均」等新特徵,不屬於選擇已有特徵。
(D) 類別型數據編碼
-
❌ 錯誤。這是資料前處理(Data Preprocessing),如 one-hot encoding 或 label encoding,用來讓類別變數能被模型理解,也不是特徵選擇的方法。
? 小提醒:
| 類別 | 代表方法 | 功能說明 |
|---|---|---|
| 特徵選擇 | 資訊增益、卡方檢定、遞迴特徵消除 | 挑出有用的原始特徵 |
| 特徵萃取 | PCA、LDA、自編碼器 | 建立新的特徵表示 |
| 特徵建構 | 時間差、統計值、交互特徵 | 根據原始資料生成新特徵 |
| 特徵編碼 | One-hot、Label Encoding | 把文字或類別轉成數值格式 |
✅ 結論:
正確答案是:
➡️ (B) 使用資訊增益方法選擇重要特徵
12
0