18. 為了能夠有效分散處理巨量資料,分散式資料處理演算法常基於下列 何種概念進行設計?
(A) 貪婪演算法(greedy)
(B) 啟發法(heuristic)
(C) 反覆迭代(iteration)
(D) 先分散(map) 後聚合(reduce)

答案:登入後查看
統計: A(1), B(1), C(2), D(8), E(0) #3219402

詳解 (共 1 筆)

#6332833

(D) 先分散(map)後聚合(reduce)

正確(本題答案)

  • 分散式資料處理的核心概念就是「分散計算 + 結果整合」,這正是 MapReduce 的基本架構。
  • MapReduce 工作流程
    1. Map(映射): 將大數據分割成多個小部分,並分派給不同的節點計算。
    2. Shuffle(洗牌): 將相同 Key 的結果彙整到一起。
    3. Reduce(歸納): 針對 Map 輸出的中間結果,進行合併、彙總或計算,最終輸出結果。
  • 此選項正確,因為 MapReduce 是 Hadoop 和 Spark 等分散式處理框架的基礎概念。

結論

正確選項(答案):

  • (D) 先分散(map) 後聚合(reduce)
0
0