18. 為了能夠有效分散處理巨量資料,分散式資料處理演算法常基於下列
何種概念進行設計?
(A) 貪婪演算法(greedy)
(B) 啟發法(heuristic)
(C) 反覆迭代(iteration)
(D) 先分散(map) 後聚合(reduce)
答案:登入後查看
統計: A(1), B(1), C(2), D(8), E(0) #3219402
統計: A(1), B(1), C(2), D(8), E(0) #3219402
詳解 (共 1 筆)
#6332833
(D) 先分散(map)後聚合(reduce)
✅ 正確(本題答案)
- 分散式資料處理的核心概念就是「分散計算 + 結果整合」,這正是 MapReduce 的基本架構。
- MapReduce 工作流程:
- Map(映射): 將大數據分割成多個小部分,並分派給不同的節點計算。
- Shuffle(洗牌): 將相同 Key 的結果彙整到一起。
- Reduce(歸納): 針對 Map 輸出的中間結果,進行合併、彙總或計算,最終輸出結果。
- 此選項正確,因為 MapReduce 是 Hadoop 和 Spark 等分散式處理框架的基礎概念。
結論
✅ 正確選項(答案):
- (D) 先分散(map) 後聚合(reduce)
0
0