大數據的定義
大數據的定義
資料來源:http://buzzorange.com/techorange/2015/05/20/big-data-use-case-000001/
定義大數據:大數據是由巨型的資料集合 (dataset) 所組成,其大小由兆元組 (TB) 到十兆億不等 (PB)。Gartner 公司的分析師 Douglas Laney 指出「大數據是大量、高速、及 / 或多變的資訊資產,它需要新型的處理方式去促成更強的決策能力、洞察力與最佳化處理」他並且指出「除非我們知道處理巨量資料的目標以及手段不然處理巨量且多變的數據還是有著技術上的困難」。
而大數據有其三種性質,稱為 3V,分別為資料量 (Volume),資料產生速度 (Velocity),以及資料多變性 (Variety)。更精確來說,大數據是無法在一定時間內由人工收集,管理,整合與判讀的巨型資料,而在這總量資料下分別比對各總小型資料組合以期在其中獲得資訊,辨認趨勢進而預測 (Hadoop: The Definitive Guide, 4th Edition)。而所謂大數據是幾乎無法用單一資料庫去進行處理,必須平行的在數十,甚至數千個伺服器上進行運算與處理。