6. 大數據(Big Data)分析中的”大量數據”,指的是哪個特性?
(A)Variety
(B)Velocity
(C)Volume
(D)Veracity。

答案:登入後查看
統計: A(71), B(58), C(310), D(19), E(0) #2294574

詳解 (共 2 筆)

#4992627

大數據(Big Data)—— 或稱巨量資料 ,顧名思義,是指大量的資訊,當資料量龐大到資料庫系統無法在合理時間內進行儲存、運算、處理,分析成能解讀的資訊時,就稱為大數據。

 

Volume 資料量

Data volume: amount of data

以前人們「手動」在表格中記錄、累積出數據;現在數據是由機器、網路、人與人之間的社群互動來生成。你現在正在點擊的滑鼠、來電、簡訊、網路搜尋、線上交易... 都正在生成累積成龐大的數據,因此資料量很容易就能達到數 TB(Tera Bytes,兆位元組),甚至上看 PB(Peta Bytes,千兆位元組)或 EB(Exabytes,百萬兆位元組)的等級。


Velocity 資料輸入輸出速度

Data velocity: speed of data in and out

資料的傳輸流動(data streaming)是連續且快速的,隨著越來越多的機器、網路使用者,社群網站、搜尋結果每秒都在成長,每天都在輸出更多的內容。公司跟機構要處理龐大的資訊大潮向他們襲來,而回應、反應這些資料的速度也成為他們最大的挑戰,許多資料要能即時得到結果才能發揮最大的價值,因此也有人會將 Velocity 認為是「時效性」。


Variety 資料類型

Data variety: range of data types and sources

大數據的來源種類包羅萬象,十分多樣化,如果一定要把資料分類的話,最簡單的方法是分兩類,結構化與非結構化。早期的非結構化資料主要是文字,隨著網路的發展,又擴展到電子郵件、網頁、社交媒體、視訊,音樂、圖片等等,這些非結構化的資料造成儲存(storage)、探勘(mining)、分析(analyzing)上的困難。


Veracity 真實性

Data veracity: uncertainty of data

這個詞由在 Express Scripts 擔任首席數據官(Chief Data Officer, CDO)的 Inderpal Bhandar 在波士頓 大數據創新高峰會(Big Data Innovation Summit) 的演講中提出,認為大數據分析中應該加入這點做考慮,分析並過濾資料有偏差、偽造、異常的部分,防止這些「dirty data」損害到資料系統的完整跟正確性,進而影響決策。

*大數據特性,謹記四字箴言:「大、快、雜、疑」

大數據資料量龐「大」(Volume)、變化飛「快」(Velocity),種類繁「雜」(Variety),以及真偽存「疑」(Veracity)。尤其在這資訊大爆炸時代,這些資料變得又多、又快、又雜、又真偽難分。

2
0
#4219684
「3V」,包括資料量(Volume)、資...
(共 52 字,隱藏中)
前往觀看
1
0