38. 關於階層式分群法(Hierarchical Clustering),下列敘述何者不正確?
(A) 若採用聚合的方式,則由樹狀結構的底部開始,將資料或群集逐次 合併
(B) 若採用分裂的方式,則由樹狀結構的頂端開始,將群集逐次分裂
(C) 群與群的距離定義為不同群聚中最近的兩個點的距離,該法稱為單 一聯結法(Single Linkage,又稱「最近法」)
(D) 事先必須告知分群數量,以利分群法之進行
統計: A(2), B(2), C(6), D(32), E(0) #3156407
詳解 (共 1 筆)
解析題目與選項:
階層式分群法(Hierarchical Clustering) 是一種無須事先指定群數的分群(Clustering)演算法,它透過計算樣本之間的距離來建立樹狀結構(dendrogram),可以分為兩種方式:
- 聚合式(Agglomerative):從個別數據點開始,逐步合併成較大的群集(自底向上,bottom-up)。
- 分裂式(Divisive):從一個大群開始,逐步將群集拆分為較小的群集(自頂向下,top-down)。
此外,階層式分群有不同的群與群距離計算方式:
- 單一聯結法(Single Linkage):計算不同群聚中最近的兩點之距離。
- 完全聯結法(Complete Linkage):計算不同群聚中最遠的兩點之距離。
- 平均聯結法(Average Linkage):計算不同群聚之間所有點的平均距離。
選項分析:
(A) 若採用聚合的方式,則由樹狀結構的底部開始,將資料或群集逐次合併 ✅ (正確)
→ 聚合式階層分群(Agglomerative Clustering)是由底部開始,逐步合併,直到所有數據點合併成一個大群集。
(B) 若採用分裂的方式,則由樹狀結構的頂端開始,將群集逐次分裂 ✅ (正確)
→ 分裂式階層分群(Divisive Clustering)是從整體開始,逐步拆分成較小的群,直到每個數據點單獨成為一群。
(C) 群與群的距離定義為不同群聚中最近的兩個點的距離,該法稱為單一聯結法(Single Linkage,又稱「最近法」) ✅ (正確)
→ 單一聯結法(Single Linkage) 是基於群與群之間最近的兩個點的距離,這種方法容易受到**鏈狀效應(chaining effect)**影響,導致過於延伸的群集。
(D) 事先必須告知分群數量,以利分群法之進行 ❌ (錯誤,正確答案!)
→ 錯誤!階層式分群法不需要事先指定分群數量,而是透過**樹狀圖(dendrogram)**來決定要切割多少個群。使用者可以根據樹狀結構的高度來選擇適當的分群數。因此,這個選項是不正確的。
正確答案:
✅ (D) 事先必須告知分群數量,以利分群法之進行
❌ (錯誤!階層式分群法不需要事先指定分群數量,而是透過樹狀結構來決定群數)