16. 下列哪一項是設計 Hadoop 分散式檔案系統(HDFS)的主要 特色?
(A) 儲存大量小檔案
(B) 具有高容錯率
(C) 低寫入延遲
(D) 支援即時查詢

答案:登入後查看
統計: A(3), B(14), C(2), D(1), E(0) #3323446

詳解 (共 1 筆)

#6329606

(B) 具有高容錯率

解析:

Hadoop 分散式檔案系統 (HDFS, Hadoop Distributed File System) 是專為大規模數據儲存和處理設計的,並具有高容錯性以確保數據的可靠性。以下是對選項的分析:

  1. (A) 儲存大量小檔案

    • HDFS 主要設計用來儲存大文件(如 TB 級或更大的數據集),並不適合儲存大量小檔案,因為 NameNode 需要追蹤所有檔案的 metadata,當小檔案數量過多時會造成 NameNode 記憶體負擔過大,影響效能。
  2. ✅ (B) 具有高容錯率 ✅(最佳答案)

    • HDFS 具有自動備援與容錯機制,透過資料副本 (replication) 來確保數據不會因節點故障而丟失。例如,預設每個區塊會有 3 份副本存儲在不同的節點,以提高容錯能力。
  3. (C) 低寫入延遲

    • HDFS 主要設計用於批次處理 (batch processing),而非低延遲寫入,因為寫入時需要處理副本分發,因此延遲較高。不適合需要頻繁寫入的應用。
  4. (D) 支援即時查詢

    • HDFS 不支援即時查詢,因為它是為大數據分析設計的,適合批次處理,而非即時查詢。若需要即時查詢,一般會使用 HBase、Spark 或 Presto 等技術來補充。

HDFS 主要特性:

  • 高容錯性:數據副本自動存儲在多個節點上,防止節點故障導致數據丟失。
  • 適合大規模數據:針對 大文件(GB/TB 級別)設計,而非小文件。
  • 批次處理優化:通常與 MapReduce、Spark 結合,用於大數據分析。
  • 可擴展性:可動態增加節點來存儲和處理更多數據。

結論:

HDFS 的核心設計目標之一是高容錯性,因此正確答案是 (B) 具有高容錯率

0
0