46. 下列何種統計機器學習方法，容許資料中存有遺缺值？
(A) 類神經網路（Artificial Neural Networks）
(B) 分類與迴歸樹（Classification and Regression Trees）
(C) K-近鄰法（K-Nearest Neighbors）
(D) 羅吉斯迴歸（Logistic Regression）

答案：登入後查看
統計： A(1), B(5), C(3), D(2), E(0) #3219180

hchungw

B1 · 2025/03/14

#6332668

在統計與機器學習方法中，多數演算法無法直接處理遺缺值（missing values），需要透過 刪除缺失資料 或 補值（Imputation） 來解決。但部分演算法可以直接應對缺失值，例如決策樹類型的方法。

❌ 錯誤（不允許缺失值）
神經網路演算法不允許直接輸入缺失值，因為：
- 欠缺值會導致數值計算錯誤，如 梯度下降（Gradient Descent） 無法正常運作。
- 必須先**使用補值方法（如均值填補、KNN 補值、插補）**來處理缺失值。
因此，ANN 不適用於含有缺失值的原始數據。

✅ 正確（允許缺失值）
決策樹（CART, Decision Trees）能夠直接處理缺失值，方法包括：
- 基於變數分裂機制，忽略遺缺值的變數，並選擇替代變數進行分類。
- 使用代理變數（Surrogate Splitting），如果主要變數缺失，則使用相關變數代替。
因此，決策樹能夠容忍缺失值，這是正確答案。

❌ 錯誤（不允許缺失值）
羅吉斯迴歸是一種基於數學公式的線性模型，無法處理遺缺值：
- 缺失值會導致無法計算對數機率（log-odds），影響模型收斂。
- 需要補值（Imputation） 來填補遺缺值，否則無法訓練模型。
因此，羅吉斯迴歸不允許直接處理缺失值。

✅ 正確答案（允許缺失值）：
(B) 分類與迴歸樹（Classification and Regression Trees, CART）

❌ 錯誤選項（不允許缺失值）：

? 本題正確答案：「(B)」