說起大數據,估計大家都覺得只聽過概念,但是具體是什麼東西,怎麼定義,沒有一個標準的東西,因為在我們的印像中好像很多公司都叫大數據公司,業務形態則有幾百種,感覺不是很好理解,所以我建議還是從字面上來理解大數據,在維克托邁爾-舍恩伯格及肯尼斯庫克耶編寫的《大數據時代》提到了大數據的4特徵:
第一個是數量比較大,只有資料體量達到了PB等級以上,才能稱為大資料。 (推薦學習:Python影片教學)
1PB等於1024TB,1TB等於1024G,那麼1PB等於1024*1024個G的資料。
第二個是價值大。
如果你有1PB以上的全國所有20-35年輕人的上網數據的時候,那麼它自然就有了商業價值,比如透過分析這些數據,我們就知道這些人的愛好,進而指導產品的發展方向等等。
如果有了全國數百萬病人的數據,根據這些數據進行分析就能預測疾病的發生,這些都是大數據的價值。
第三個就是多樣性。
如果只有單一的數據,那麼這些數據就沒有了價值,例如只有單一的個人數據,或者單一的用戶提交數據,這些數據還不能稱為大數據,所以說大數據還需要是多樣性的。
例如目前的上網用戶中,年齡,學歷,愛好,性格等等每個人的特徵都不一樣,這個也就是大數據的多樣性,當然瞭如果擴展到全國,那麼數據的多樣化性會更強,每個地區,每個時間段,都會存在各種各樣的數據多樣性。
第四個是速度快。
就是透過演算法對資料的邏輯處理速度非常快,1秒定律,可從各種類型的資料中快速獲得高價值的信息,這一點也是和傳統的資料探勘技術有著本質的不同。
更多Python相關技術文章,請造訪Python教學欄位學習!
以上是大數據擅長處理哪個層級的數據的詳細內容。更多資訊請關注PHP中文網其他相關文章!