11. 企業資料分析團隊使用 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)演算法進行顧客行為分群,並希望模型能自動區分主要群集與雜訊資料。 在此演算法中,決定聚類結果的兩個主要超參數為下列何者?
(A)特徵數與學習率;
(B)K 值與距離閾值;
(C)鄰域半徑(Epsilon ε)與最小點數(MinPts);
(D)交叉熵(Cross Entropy)與權重初始化
答案:登入後查看
統計: A(0), B(5), C(27), D(5), E(0) #3773562
統計: A(0), B(5), C(27), D(5), E(0) #3773562
詳解 (共 2 筆)
#7373131
DBSCAN 的聚類結果主要由以下兩個超參數決定:
- 鄰域半徑 (Epsilon,或 eps):定義了以某個點為中心,搜尋相鄰點的半徑範圍。
- 最小點數 (MinPts 或 min_samples):定義了在半徑Epsilon範圍內,至少需要多少個點才算是一個高密度區域(核心點)。
若 Epsilon設置過小,會導致大部分點被視為雜訊;若 Epsilon過大,則會導致不同的群集被合併。
0
0