19. 關於巨量資料處理,下列敘述何者「不正確」?
(A) 分散式架構處理可以提升巨量資料處理效能
(B) 透過 API 或者網路爬蟲的方式,可以來搜集大量外部資料,例如網站資料
(C) 可以根據運算需求與時效性,平行擴增所需要的運算資源,提供更好的運算服務
(D) 許多資料要能即時得到結果才能發揮最大的價值,即為巨量資料所談的「Value」
答案:登入後查看
統計: A(0), B(0), C(1), D(8), E(0) #3219153
統計: A(0), B(0), C(1), D(8), E(0) #3219153
詳解 (共 1 筆)
#6332642
要找出 「不正確」 的選項,我們逐一檢視每個選項是否符合巨量資料(Big Data)的特性與應用:
-
(A) 分散式架構處理可以提升巨量資料處理效能
- 正確 ✅
- 巨量資料通常需要透過 分散式運算架構(如 Hadoop、Spark)來提升處理效能。
- 這是因為單一機器難以處理大規模數據,因此透過分散式架構可將計算與儲存負載分配到多個節點,提高效能。
-
(B) 透過 API 或者網路爬蟲的方式,可以來搜集大量外部資料,例如網站資料
- 正確 ✅
- 許多巨量資料分析的來源之一就是來自 API、網路爬蟲(Web Scraping)或開放資料(Open Data)。例如:
- 搜集社群媒體數據(如 Twitter API)。
- 使用網頁爬蟲蒐集新聞、評論等資訊。
- 擷取政府開放數據(如 Open Data)。
- 這些方式確實是常見的 資料蒐集方法。
-
(C) 可以根據運算需求與時效性,平行擴增所需要的運算資源,提供更好的運算服務
- 正確 ✅
- 巨量資料處理通常採用 彈性擴展架構(Elastic Scaling),如雲端運算(AWS、Google Cloud、Azure)能根據需求 動態調整計算資源,即所謂的 橫向擴展(Scale Out)。
-
(D) 許多資料要能即時得到結果才能發揮最大的價值,即為巨量資料所談的「Value」
- 錯誤 ❌(答案)
- 「Value(價值)」 是 巨量資料的 5V 特性之一(Volume, Velocity, Variety, Veracity, Value),但不代表所有巨量資料都必須即時處理。
- 事實上,巨量資料可以分為:
- 批次處理(Batch Processing) → 如 Hadoop、ETL,重點在 準確性 而非即時性。
- 即時處理(Real-Time Processing) → 如 Spark Streaming、Kafka,適用於高時效需求。
- 巨量資料的「Value」重點在於數據是否能產生商業價值,而非一定要即時處理。
結論
✅ 正確選項:(A)、(B)、(C)
❌ 不正確選項:(D) (即時處理不是「Value」的唯一條件)
? 本題正確答案:「(D)」
0
0