握住科學鑰匙 打開科學之門

首頁 > 正文

大數據知多少?

2019-09-21 09:47  來源: 新華網

隨著時代進步和科技發展,大數據逐步為人類創造出更多的價值。你知道大數據的概念是什麼嗎?它又有怎樣的特點呢?

 

 

大數據又稱巨量數據、海量數據,是由數量巨大、結構復雜、類型眾多的數據構成的數據集合,基于雲計算的數據處理與應用模式,通過數據的集成共享,交叉復用形成的智力資源和知識服務能力。也有相關機構對其有所定義:“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資産。換言之,大數據就是在浩如煙海的信息中,利用數據分析的技術,對冗雜無序的數據進行分析和整理,並迅速篩選出有價值的信息。

2010年10月,麥肯錫在《大數據:創新競爭和提高生産率的下一個新領域》的研究報告裏正式使用“大數據”一詞,並最早提出“大數據”時代已經到來。簡單地説,“大數據”即“海量數據”+復雜類型的數據,麥肯錫認為大數據就是指無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。大數據有4個方面的典型特徵:數據體量巨大、數據類型繁多、價值密度低、處理速度快。

大數據可以將數據分析和整合的結果應用于為企業提供決策支持,也可以將分析與建模的成果轉化為具體的應用集成到業務流程中,為業務直接提供數據的支持。大數據的應用一般分為兩類。一類是嵌入業務流程的數據輔助功能,如我們在網絡購物時,經常會有“相關推薦”“猜你喜歡”等購物推薦,這就是通過數據分析與建模,分析我們的購物喜好,進行數據整合和篩選,最終得出推薦給我們的內容。另一類則是以數據為驅動的業務場景,如我們在出行前進行相關準備時,經常會在網絡上對住宿,門票,車票等進行比價,這就是在採集各電商網站報價的基礎上,利用大數據對同一産品進行識別和排序,從而得到最優方案。

提到大數據的發展,我們不得不提到一個概念——大數據的生命周期。事實上,它指的是某個集合的大數據從産生和獲取到銷毀的過程。也就是企業在實際運用大數據的過程中,在大數據戰略的基礎上,定義大數據范圍,確定大數據採集、存儲、整合、呈現與使用、分析與應用、歸檔與銷毀的流程,並根據數據和應用的狀況,對該流程進行持續優化。

隨著移動互聯網、物聯網、雲計算技術的迅速發展,大數據技術也越來越受人們關注。

本作品為“科普中國-科學原理一點通”原創,轉載時務請注明出處。

作者: 朱寅瑩   [責任編輯: 李浩]