大數據的四個特徵:1、資料體量龐大;2、資料類型繁多;3、價值密度低;4、處理速度快。
大資料的四個特徵:
一是資料量龐大(Volume)。
截至目前,人類生產的所有印刷材料的資料量是200PB(1PB=210TB),而歷史上全人類說過的所有的話的資料量大約是5EB(1EB=210PB)。目前,典型個人電腦硬碟的容量為TB量級,而一些大企業的資料量已經接近EB量級。
二是資料類型繁多(Variety)。
這種類型的多樣性也讓資料被分成結構化資料和非結構化資料。相對於以往便於儲存的以文字為主的結構化數據,非結構化資料越來越多,包括網路日誌、音訊、視訊、圖片、地理位置資訊等,這些多類型的資料對資料的處理能力提出了更高要求。
三是價值密度低(Value)。
價值密度的高低與資料總量的大小成反比。以視頻為例,一部1小時的視頻,在連續不間斷的監控中,有用數據可能只有一、二秒。如何透過強大的機器演算法更迅速地完成資料的價值「提純」成為目前大數據背景下亟待解決的難題。
四是處理速度快(Velocity)。
這是大數據區分於傳統資料探勘的最顯著特徵。根據IDC的「數位宇宙」的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的資料面前,處理資料的效率就是企業的生命。
相關學習推薦:網站建立教學
以上是簡述大數據的四個特徵的詳細內容。更多資訊請關注PHP中文網其他相關文章!