140. 特徵工程中的特徵選擇方法包括以下哪一項?
(A) 使用 PCA 提取信息
(B) 使用信息增益方法選擇重要 特徵
(C) 根據時間序列生成新特徵
(D) 類別型數據編碼

答案:登入後查看
統計: A(227), B(412), C(37), D(44), E(0) #3416415

詳解 (共 1 筆)

#6557625

正確答案是:(B) 使用資訊增益方法選擇重要特徵

✅ 解釋:

特徵選擇(Feature Selection)是特徵工程中的一個關鍵步驟,目的是從原始特徵中挑出對模型有幫助的特徵,排除不重要或干擾的特徵,以提升模型效能、降低維度與過擬合風險。

各選項解析:

✅ (B) 使用資訊增益方法選擇重要特徵

  • 正確,資訊增益(Information Gain)是特徵選擇中**常用的過濾法(filter method)**之一,尤其在分類問題(像是決策樹)中非常常見。

  • 它衡量特徵對目標變數的不確定性減少程度,是一種有效的評估方式。

其他選項為錯誤或混淆概念:

(A) 使用 PCA 提取信息

  • ❌ 錯誤。PCA 是**特徵萃取(Feature Extraction)**方法,不是特徵選擇。

  • 特徵選擇是從原始特徵中挑選一部分
    而特徵萃取是用原始特徵組合出新的特徵

(C) 根據時間序列生成新特徵

  • ❌ 錯誤。這是特徵建構(Feature Construction),例如加入「前一天值」、「移動平均」等新特徵,不屬於選擇已有特徵。

(D) 類別型數據編碼

  • ❌ 錯誤。這是資料前處理(Data Preprocessing),如 one-hot encoding 或 label encoding,用來讓類別變數能被模型理解,也不是特徵選擇的方法。

? 小提醒:

類別 代表方法 功能說明
特徵選擇 資訊增益、卡方檢定、遞迴特徵消除 挑出有用的原始特徵
特徵萃取 PCA、LDA、自編碼器 建立新的特徵表示
特徵建構 時間差、統計值、交互特徵 根據原始資料生成新特徵
特徵編碼 One-hot、Label Encoding 把文字或類別轉成數值格式

✅ 結論:

正確答案是:
➡️ (B) 使用資訊增益方法選擇重要特徵

12
0