18. 為了能夠有效分散處理巨量資料，分散式資料處理演算法常基於下列何種概念進行設計？
(A) 貪婪演算法（greedy）
(B) 啟發法（heuristic）
(C) 反覆迭代（iteration）
(D) 先分散（map) 後聚合（reduce）

答案：登入後查看
統計： A(1), B(1), C(2), D(8), E(0) #3219402

詳解 (共 1 筆)

hchungw

B1 · 2025/03/14

#6332833

(D) 先分散（map）後聚合（reduce）

✅ 正確（本題答案）

分散式資料處理的核心概念就是「分散計算 + 結果整合」，這正是 MapReduce 的基本架構。
MapReduce 工作流程：
1. Map（映射）： 將大數據分割成多個小部分，並分派給不同的節點計算。
2. Shuffle（洗牌）： 將相同 Key 的結果彙整到一起。
3. Reduce（歸納）： 針對 Map 輸出的中間結果，進行合併、彙總或計算，最終輸出結果。
此選項正確，因為 MapReduce 是 Hadoop 和 Spark 等分散式處理框架的基礎概念。

結論

✅ 正確選項（答案）：

(D) 先分散（map) 後聚合（reduce）

0

0