31. 關於主成分分析(Principal Component Analysis, PCA)屬性萃取的主 要用途,下列敘述何者正確?
(A) 以長條圖視覺化多變量資料
(B) 將低度相關的預測變數矩陣 x,轉換成相關且量多的潛在變項集合
(C) 將最攸關的訊息與無關的雜訊結合
(D) 將問題領域中的數個變數,組合成單一或數個具訊息力的特徵變數

答案:登入後查看
統計: A(1), B(0), C(1), D(8), E(0) #3219165

詳解 (共 1 筆)

#6332651

解析各選項,找出「正確」的敘述:

(A) 以長條圖視覺化多變量資料

  • 錯誤
  • PCA 的主要目標不是長條圖視覺化,而是降維(Dimensionality Reduction)特徵萃取(Feature Extraction)
  • 常用的 PCA 視覺化方法包括
    • 碎石圖(Scree Plot) → 顯示主成分的解釋變異數比例
    • 雙標圖(Biplot) → 顯示變數和樣本在主成分空間的分佈
  • 長條圖並非 PCA 的典型視覺化工具,因此 錯誤

(B) 將低度相關的預測變數矩陣 x,轉換成相關且量多的潛在變項集合

  • 錯誤
  • PCA 主要的目標是將原始變數轉換成「線性不相關(uncorrelated)」的新變數(主成分, Principal Components, PC)
  • 錯誤點
    • PCA 不是增加變數數量,而是降低維度(即減少變數數量)。
    • PCA 不是讓變數變得相關,而是讓新主成分之間互不相關
  • 正確的敘述應該是:「將高度相關的變數轉換成互不相關的主成分」。

(C) 將最攸關的訊息與無關的雜訊結合

  • 錯誤
  • PCA 目標是分離訊息與雜訊,而非結合
  • PCA 會:
    • 保留最具變異量(variance)的資訊,以便壓縮數據。
    • 忽略變異量小的成分,這些成分通常包含雜訊。
  • 因此 PCA 的作用是過濾雜訊,而不是把雜訊與重要資訊合併,所以此敘述錯誤。

(D) 將問題領域中的數個變數,組合成單一或數個具訊息力的特徵變數

  • 正確(答案)
  • PCA 的核心目標
    • 透過線性變換(Linear Transformation),將高維數據映射到較少的「主成分」上,這些主成分是資訊最豐富的變數組合。
    • 這些新變數(主成分, PC)仍保留數據中的主要訊息,而降低維度,減少冗餘資訊
  • 這個選項正確描述了 PCA 的降維與特徵提取的核心用途

結論

正確答案(D) 將問題領域中的數個變數,組合成單一或數個具訊息力的特徵變數
錯誤選項(A)、(B)、(C)

? 本題正確答案:「(D)」

0
0