大量(Volume)
多樣(Variety)
快速(Velocity)
關聯式資料庫(英語:Relational database),是建立在關聯模型基礎上的資料庫,藉助於集合代數等數學概念和方法來處理資料庫中的資料。現實世界中的各種實體以及實體之間的各種聯絡均用關聯模型來表示。關聯模型是由埃德加·科德於1970年首先提出的,並配合「科德十二定律」。現如今雖然對此模型有一些批評意見,但它還是資料儲存的傳統標準。標準資料查詢語言SQL就是一種基於關聯式資料庫的語言,這種語言執行對關聯式資料庫中資料的檢索和操作。
關聯模型由關聯資料結構、關聯操作集合、關聯完整性約束三部分組成。
實體關係模型 編輯
主條目:實體關係模型
實體關係模型(Entity-Relationship Model),簡稱E-R Model,是陳品山(Peter P.S Chen)博士於1976年提出的一套資料庫的設計工具,他運用真實世界中事物與關係的觀念,來解釋資料庫中的抽象的資料架構。實體關係模型利用圖形的方式(實體-關係圖(Entity-Relationship Diagram))來表示資料庫的概念設計,有助於設計過程中的構思及溝通討論。
在一份2001年的研究與相關的演講中[17],麥塔集團(META Group,現為高德納)分析員道格·萊尼(Doug Laney)指出數據長的挑戰和機遇有三個方向:量(Volume,數據大小)、速(Velocity,資料輸入輸出的速度)與多變(Variety,多樣性),合稱「3V」或「3Vs」。高德納與現在大部份巨量資料產業中的公司,都繼續使用3V來描述巨量資料[18]。高德納於2012年修改對巨量資料的定義:「巨量資料是大量、高速、及/或多變的資訊資產,它需要新型的處理方式去促成更強的決策能力、洞察力與最佳化處理[原文 1][19]。」另外,有機構在3V之外定義第4個V:真實性(Veracity)為第四特點[20]。