150. 數據集劃分時,驗證集的主要用途是什麼?
(A) 用於模型訓練
(B) 調整模型的超參數
(C) 測試模型性能
(D) 確保數據隨機分布

答案:登入後查看
統計: A(75), B(294), C(190), D(64), E(0) #3416425

詳解 (共 1 筆)

#6557615

正確答案是:(B) 調整模型的超參數

解釋如下:

在機器學習中,資料集通常會被切分為三部分:

  1. 訓練集(Training Set)
    ➤ 用來訓練模型的參數(例如權重)。

  2. 驗證集(Validation Set)
    ➤ 用來調整模型的超參數,例如學習率、樹的深度、K 值等;同時也用來**早停(early stopping)**以避免過擬合。
    ✅ 所以選擇 (B) 是正確的。

  3. 測試集(Test Set)
    ➤ 用來最終評估模型的泛化能力與性能,不能用來訓練或選擇模型。
    → 這才是 (C) 所說的「測試模型性能」。

其他選項說明:

  • (A):訓練模型是訓練集的工作,不是驗證集。

  • (C):測試模型性能應該用的是測試集,不是驗證集。

  • (D):資料隨機分布是切分資料集時的原則之一,但並不是驗證集主要用途。

總結:

驗證集的主要用途是:
➡️ 在訓練過程中,用來調整模型的超參數與監控模型的過擬合情況。

✅ 正確答案是:(B)

6
0