大數據是指規模巨大、類型多樣、增長速度快的數據集合,它的處理和分析超出了傳統數據庫軟件的能力範圍。大數據的特性通常用五個V來描述,即Volume(體積)、Velocity(速度)、Variety(多樣性)、Veracity(真實性)和Value(價值)。下面分別對這些特性進行解釋:
Volume(體積):
Velocity(速度):
Variety(多樣性):
Veracity(真實性):
Value(價值):
這五個V共同描述了大數據的主要特點,並指導著如何有效地管理和利用這些數據資源。
(一)巨量性(Volumn)
資料通常是以 TB、PB、EB 等級的資料量為基本單位,必須對 產生的大量數據資料進行處理與保存。
(二)時效性(Velocity)
數據產生及變化快速,故資料的處理與反應也必須即時快速。
(三)多樣性(Variety)
龐大的資料來自四面八方,型態包括文字、影音、圖像、網頁、 串流等結構及非結構化數據,甚或是沒有格式的,因此處理方式 較複雜,難度也高。
(四)Veracity(真實性)
收集到的資訊必需具備真實性,對錯誤的資料進行分析,結果也 不會是正確的,造成所謂的 GIGO(Garbage in,Garbage out;垃圾進,垃圾出)問題。
(五)價值性 (Value),指的是大數據分析需要耗費大量人成本,故必須考量數 據轉換是否具有價值。