大數據的4v特徵分別是:1、規模性(Volume);隨著資訊化技術的高速發展,資料開始爆發性成長。 2、高速性(Velocity)。 3.多樣性(Variety);主要體現在資料來源多、資料型別多、資料之間關聯性強;4、價值性(Value)。
本文操作環境:windows10系統、thinkpad t480電腦。
大數據(big data),IT行業術語,是指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高成長率和多樣化的資訊資產。
大數據的4v特徵
大數據的特徵,由維克托邁爾-舍恩伯格和肯尼斯克耶編寫的《大數據時代》中提出,大數據的4V特徵:規模性(Volume)、高速性(Velocity)、多樣性(Variety)、價值性(Value)。
(1)規模性
隨著資訊化技術的快速發展,資料開始爆發性成長。大數據中的數據不再以幾個GB或幾個TB為單位來衡量,而是以PB(1千個T)、EB(1百萬個T)或ZB(10億個T)為計量單位。
(2)多樣性
多樣性主要體現在資料來源多、資料型別多、資料之間關聯性強這三個面向。
①數據來源多,企業面對的傳統數據主要是交易數據,而互聯網和物聯網的發展,帶來了社交網站、感測器等多種來源的數據。
而由於數據來自不同的應用系統和不同的設備,決定了大數據形式的多樣性。大體可分為三類:一是結構化數據,如財務系統數據、資訊管理系統數據、醫療系統數據等,其特點是數據間因果關係強;二是非結構化的數據,如視頻、圖片、音頻等,其特徵是數據間沒有因果關係;三是半結構化數據,如HTML文檔、郵件、網頁等,其特徵是數據間的因果關係較弱。
②資料型別多,且以非結構化資料為主。傳統的企業中,資料都是以表格的形式保存。而大數據中有70%-85%的數據是如圖片、音訊、視訊、網路日誌、連結資訊等非結構化和半結構化的資料。
③資料之間關聯性強,頻繁交互,如遊客在旅遊途中上傳的照片和日誌,就與遊客的位置、行程等資訊有很強的關聯性。
(3)高速性
這是大數據區分於傳統資料探勘最顯著的特徵。大數據與大量資料的重要差異在兩方面:一方面,大數據的資料規模更大;另一方面,大數據對處理資料的回應速度有更嚴格的要求。即時分析而非批次分析,資料輸入、處理與丟棄立刻見效,幾乎無延遲。資料的成長速度和處理速度是大數據高速性的重要體現。
(4)價值性
儘管企業擁有大量數據,但是發揮價值的僅是其中非常小的部分。大數據背後潛藏的價值龐大。由於大數據中有價值的數據所佔比例很小,而大數據真正的價值體現在從大量不相關的各種類型的數據中。挖掘出對未來趨勢與模式預測分析有價值的數據,並透過機器學習方法、人工智慧方法或資料探勘方法深度分析,並運用於農業、金融、醫療等各個領域,以期創造更大的價值。
想要查閱更多相關文章,請造訪PHP中文網! !
以上是大數據的4v特徵分別是什麼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!