11. 企業資料分析團隊使用 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)演算法進行顧客行為分群,並希望模型能自動區分主要群集與雜訊資料。 在此演算法中,決定聚類結果的兩個主要超參數為下列何者?
(A)特徵數與學習率;
(B)K 值與距離閾值;
(C)鄰域半徑(Epsilon ε)與最小點數(MinPts);
(D)交叉熵(Cross Entropy)與權重初始化

答案:登入後查看
統計: A(0), B(5), C(27), D(5), E(0) #3773562

詳解 (共 2 筆)

#7367503
為什麼選 (C)?核心邏輯解...
(共 807 字,隱藏中)
前往觀看
1
0
#7373131

DBSCAN 的聚類結果主要由以下兩個超參數決定:

  • 鄰域半徑 (Epsilon, eps):定義了以某個點為中心,搜尋相鄰點的半徑範圍。
  • 最小點數 (MinPts min_samples):定義了在半徑Epsilon範圍內,至少需要多少個點才算是一個高密度區域(核心點)。

Epsilon設置過小,會導致大部分點被視為雜訊;若 Epsilon過大,則會導致不同的群集被合併。

0
0

私人筆記 (共 1 筆)

私人筆記#8068336
未解鎖
為什麼選 (C)?核心邏輯解析 DBSC...
(共 788 字,隱藏中)
前往觀看
1
0