3. 下列哪一項「不」是資料前處理的步驟？
(A) 資料清理（Data Cleaning）
(B) 資料整合（Data Integration）
(C) 資料建模（Data Modeling）
(D) 資料變形（Data Reshaping）

答案：登入後查看
統計： A(1), B(0), C(47), D(1), E(0) #3103428

hchungw

B1 · 2025/03/07

#6324653

(C) 資料建模（Data Modeling） ❌不屬於資料前處理的步驟

資料前處理 (Data Preprocessing) 是機器學習和數據分析的重要步驟，目的是清理、轉換和準備數據，以便提升模型的準確性和效能。前處理的主要步驟包括資料清理、資料整合、資料變形等。

✅ (A) 資料清理（Data Cleaning） ✅ 屬於資料前處理

目標是處理缺失值、異常值、重複數據，確保數據品質。
常見方法：
- 移除或填補遺缺值 (Missing Values Imputation)。
- 移除重複數據 (Duplicate Removal)。
- 修正不一致數據 (Data Consistency Checking)。

✅ (B) 資料整合（Data Integration） ✅ 屬於資料前處理

合併來自多個來源的數據，確保數據一致性。
常見場景：
- 不同資料庫的整合 (如 SQL 合併)。
- 去除重複的屬性 (Duplicate Attributes)。
- 標準化不同數據格式。

❌ (C) 資料建模（Data Modeling） ❌不屬於資料前處理

資料建模是機器學習的核心步驟，不是前處理。
建模 (Modeling) 主要是指選擇演算法、訓練模型、調整超參數、評估效能，例如：
- 訓練線性回歸、決策樹、神經網路等模型。
- 進行交叉驗證 (Cross-validation) 和超參數調整 (Hyperparameter Tuning)。

✅ (D) 資料變形（Data Reshaping） ✅ 屬於資料前處理

目標是將數據轉換成適合分析或建模的結構。
常見方法：
- 正規化 (Normalization) / 標準化 (Standardization)。
- 資料轉置 (Transpose) / 重新塑形 (Reshape)。
- 特徵工程 (Feature Engineering)。

✔ 「不屬於資料前處理的步驟」的選項是 (C) 資料建模（Data Modeling），因為建模是機器學習的主要階段，而非數據預處理的一部分。