3. 下列哪一項「不」是資料前處理的步驟?
(A) 資料清理(Data Cleaning)
(B) 資料整合(Data Integration)
(C) 資料建模(Data Modeling)
(D) 資料變形(Data Reshaping)
答案:登入後查看
統計: A(1), B(0), C(47), D(1), E(0) #3103428
統計: A(1), B(0), C(47), D(1), E(0) #3103428
詳解 (共 1 筆)
#6324653
(C) 資料建模(Data Modeling) ❌不屬於資料前處理的步驟
解析:
資料前處理 (Data Preprocessing) 是機器學習和數據分析的重要步驟,目的是清理、轉換和準備數據,以便提升模型的準確性和效能。前處理的主要步驟包括資料清理、資料整合、資料變形等。
選項分析
✅ (A) 資料清理(Data Cleaning) ✅ 屬於資料前處理
- 目標是處理缺失值、異常值、重複數據,確保數據品質。
- 常見方法:
- 移除或填補遺缺值 (Missing Values Imputation)。
- 移除重複數據 (Duplicate Removal)。
- 修正不一致數據 (Data Consistency Checking)。
✅ (B) 資料整合(Data Integration) ✅ 屬於資料前處理
- 合併來自多個來源的數據,確保數據一致性。
- 常見場景:
- 不同資料庫的整合 (如 SQL 合併)。
- 去除重複的屬性 (Duplicate Attributes)。
- 標準化不同數據格式。
❌ (C) 資料建模(Data Modeling) ❌不屬於資料前處理
- 資料建模是機器學習的核心步驟,不是前處理。
- 建模 (Modeling) 主要是指選擇演算法、訓練模型、調整超參數、評估效能,例如:
- 訓練線性回歸、決策樹、神經網路等模型。
- 進行交叉驗證 (Cross-validation) 和超參數調整 (Hyperparameter Tuning)。
✅ (D) 資料變形(Data Reshaping) ✅ 屬於資料前處理
- 目標是將數據轉換成適合分析或建模的結構。
- 常見方法:
- 正規化 (Normalization) / 標準化 (Standardization)。
- 資料轉置 (Transpose) / 重新塑形 (Reshape)。
- 特徵工程 (Feature Engineering)。
結論
✔ 「不屬於資料前處理的步驟」的選項是 (C) 資料建模(Data Modeling),因為建模是機器學習的主要階段,而非數據預處理的一部分。
0
0