164. 巨量資料運用的處理包括:「採集」、「導入/預處理」、「統計與分析」及「資料探勘」等,何者錯誤?
(A)巨量資料的採集是指利用多個資料庫來接收發自客戶端(Web、App 或者感測器形式等)的數據,並且用戶可以透過這些資料庫來進行簡單的查詢和處理工作
(B)雖然採集端本身會有很多資料庫,但是如果要對這些巨量資料進行有效的分析,還是應該將這些來自前端的數據導入到一個集中的大型分散式資料庫,或者分散式儲存叢集(Cluster),並且可以在導入基礎上做一些簡單的篩選和預處理工作
(C)統計與分析主要利用集中式資料庫,或者集中式計算叢集(Cluster)來對儲存於其內的巨量資料進行普通的分析和分類彙總等,以滿足大多數常見的分析需求
(D)資料探勘一般沒有什麼預先設定好的主題,主要是在現有數據上面進行基於各種演算法的計算,從而起到預測(Predict)的效果,從而實現一些高級別數據分析的需求 。