首頁 常見問題 《大數據時代》一書中的大數據是指什麼

《大數據時代》一書中的大數據是指什麼

Feb 14, 2022 am 11:44 AM
大數據

“大數據時代”一書中的大數據是指“全體數據或所有數據”,又稱“巨量資料”,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。

《大數據時代》一書中的大數據是指什麼

本教學操作環境:windows7系統、Dell G3電腦。

《大數據時代》一書中的大數據是指「全體資料或所有資料」。

大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。

在維克多·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據的方法)大數據的4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。

大數據概念的發展歷史:

「大數據」這個術語最早期的引用可追溯到apache org的開源專案Nutch。當時,大數據被用來描述為更新網路搜尋索引需要同時進行大量處理或分析的大量資料集。隨著GoogleMapReduce和Google File System (GFS)的發布,大數據不再只用來描述大量的數據,還涵蓋了處理數據的速度。

早在1980年,著名未來學家阿爾文·托夫勒便在《第三波》一書中,將大數據熱情地讚頌為“第三波的華彩樂章” 。

不過,大約從2009年開始,「163大數據」才成為網路資訊科技產業的流行詞彙。美國網路資料中心指出,網路上的資料每年將成長50%,每兩年便將翻一番,而目前全球90%以上的資料是最近幾年才產生的。此外,數據並非單純指人們在網路上發布的訊息,全世界的工業設備、汽車、電錶上有著無數的數位感測器,隨時測量並傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質的變化,也產生了海量的數據資訊。

大數據概念結構:

大數據就是網路發展到現今階段的一種表像或特徵而已,沒有必要神話它或對它保持敬畏之心,在以雲端運算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的數據開始容易被利用起來了,透過各行各業的不斷創新,大數據會逐步為人類創造更多的價值。

其次,想要係統的認知大數據,必須要全面而細緻的分解它,我著手從三個層面來展開:

第一層面是理論,理論是認知的必經途徑,也是廣為認同與傳播的基線。我會從大數據的特徵定義理解產業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的長久博弈。

第二層面是技術,技術是大數據價值體現的手段和前進的基石。我將分別從雲端運算、分散式處理技術、儲存技術和感知技術的發展來說明大數據從採集、處理、儲存到形成結果的整個過程。

第三層面是實踐,實踐是大數據的最終價值體現。我將分別從網路的大數據,政府的大數據,企業的大數據和個人的大數據四個面向來描繪大數據已經展現的美好景象及即將實現的藍圖。

大數據概念的特點:

大數據分析比起傳統的資料倉儲應用,具有資料量大、查詢分析複雜等特點。 《電腦學報》刊登的「架構大數據:挑戰、現況與展望」一文列舉了大數據分析平台需要具備的幾個重要特性,對當前的主流實現平台——並行資料庫、MapReduce及基於兩者的混合架構進行了分析歸納,指出了各自的優勢及不足,同時也對各個方向的研究現狀及作者在大數據分析方面的努力進行了介紹,對未來研究做了展望。

大數據的4個“V”,或者說特點有四個層面:第一,資料體積龐大。從TB級別,躍升到PB級別;第二,資料類型繁多。前文提到的網誌、影片、圖片、地理位置資訊等等。第三,處理速度快,1秒定律,可從各種類型的資料中快速獲得高價值的訊息,這一點也是和傳統的資料探勘技術有著本質的不同。第四,只要合理利用數據並進行正確、準確的分析,將會帶來很高的價值回報。業界將其歸納為4個「V」-Volume(大量)、Variety(多元)、Velocity(高速)、Value(價值)。

從某種程度上說,大數據是資料分析的尖端技術。簡言之,從各種類型的數據中,快速獲得有價值資訊的能力,就是大數據技術。明白這一點至關重要,也正是這一點促使該技術具備走向眾多企業的潛力。

大數據概念的用途:

大數據可分成大數據科技、大數據工程、大數據科學和大數據應用等領域。目前人們談論最多的是大數據技術和大數據應用。工程和科學問題尚未被重視。大數據工程指大數據的規劃建設運營管理的系統工程;大數據科學關注大數據網絡發展和運營過程中發現和驗證大數據的規律及其與自然和社會活動之間的關係。

物聯網、雲端運算、行動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數據來源或者承載的方式。

有些例子包括網絡日誌,RFID,感測器網絡,社會網絡,社會數據(由於數據革命的社會),互聯網文本和文件;互聯網搜索索引;呼叫詳細記錄,天文學,大氣科學,基因組學,生物地球化學,生物,和其他複雜和/或跨學科的科研,軍事偵察,醫療記錄;攝影檔案館視頻檔案;和大規模的電子商務。

大數據的作用

對於一般的企業而言,大數據的作用主要表現在兩個方面,分別是數據的分析使用與進行二次開發項目。透過對禧金資訊大數據進行分析,不僅能把隱藏的數據挖掘出來,還能透過這些隱藏的訊息,透過實體的銷售,提升自己的客戶來源。至於對資料進行二次開發,在網路服務專案中被運用的比較多,透過將這些資訊進行總結與分析,從而製定出符合客戶需求的個人化方案,並營造出一種全新的廣告行銷方式,在這裡,你需要明白的是,透過大數據的分析,將產品與服務結合起來的並不是偶然事件,而實現這種的往往是數據時代的領導者。

綜上所述,大數據的運用,不僅標誌著時代的進步,同時也激勵人們進行更深層領域的探究。此外,針對大數據的研究,除了上述內容外,還需要了解大數據的三個特徵,分別是規模大、運轉速度快及資料多樣性。透過這三個面向的研究,不僅可以更容易的觀察到資料的本質嗎,有利於軟體處理平台的有效運作。

更多相關知識,請造訪常見問題欄位!

以上是《大數據時代》一書中的大數據是指什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

PHP 的大數據結構處理技巧 PHP 的大數據結構處理技巧 May 08, 2024 am 10:24 AM

大數據結構處理技巧:分塊:分解資料集並分塊處理,減少記憶體消耗。生成器:逐一產生資料項,無需載入整個資料集,適用於無限資料集。流:逐行讀取檔案或查詢結果,適用於大檔案或遠端資料。外部儲存:對於超大資料集,將資料儲存在資料庫或NoSQL中。

2024年AEC/O產業五大發展趨勢 2024年AEC/O產業五大發展趨勢 Apr 19, 2024 pm 02:50 PM

AEC/O(Architecture,Engineering&Construction/Operation)指在建築業中提供建築設計、工程設計、施工及營運的綜合服務。 2024年,AEC/O產業在技術進步中面臨不斷變化的挑戰。今年預計將整合先進技術,預示著設計、建造和營運的典範轉移。為了因應這些變化,業界正在重新定義工作流程,調整優先級,增強合作,以適應快速變化世界的需求。 AEC/O產業以下五大趨勢將成為2024年的關鍵主題,推薦其邁向更整合、反應迅速且永續的未來:一體化供應鏈、智慧工

C++開發經驗分享:C++大數據程式設計的實務經驗 C++開發經驗分享:C++大數據程式設計的實務經驗 Nov 22, 2023 am 09:14 AM

在網路時代,大數據成為了一種新的資源,伴隨著大數據分析技術的不斷提升,大數據程式設計需求也愈發迫切。而C++作為一種廣泛應用的程式語言,其在大數據程式設計上的獨特優勢也日益凸顯。以下將分享我在C++大數據程式設計的實作經驗。一、選擇合適的資料結構選擇合適的資料結構是編寫高效大數據程式的重要環節。 C++中有多種資料結構可以供我們使用,如陣列、鍊錶、樹、雜湊表等

演算法在 58 畫像平台建置中的應用 演算法在 58 畫像平台建置中的應用 May 09, 2024 am 09:01 AM

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

Go語言大數據框架缺失原因及解決方案探討 Go語言大數據框架缺失原因及解決方案探討 Mar 29, 2024 pm 12:24 PM

在當今大數據時代,數據處理和分析已成為各行業發展的重要支持。而Go語言作為一種開發效率高、效能優越的程式語言,也逐漸被大數據領域所關注。然而,相較於其他語言如Java、Python等,Go語言在大數據框架上的支援相對不足,這給一些開發者帶來了困擾。本文將探討Go語言大數據框架缺失的主要原因,並提出對應的解決方案,同時結合具體的程式碼範例進行說明。一、Go語

入門指南:使用Go語言處理大數據 入門指南:使用Go語言處理大數據 Feb 25, 2024 pm 09:51 PM

Go語言作為一種開源程式語言,在近年來逐漸受到了廣泛的關注和使用。它以其簡潔、高效的特性,以及強大的並發處理能力而備受程式設計師青睞。在大數據處理領域中,Go語言也具有很強的潛力,可以用來處理大量資料、最佳化效能,並且可以很好地與各種大數據處理工具和框架進行整合。在本文中,我們將介紹一些Go語言大數據處理的基本概念和技巧,並透過具體的程式碼範例來展示如何利用Go語言

AI、數位孿生、視覺化…2023易知微秋季產品發表會亮點集結! AI、數位孿生、視覺化…2023易知微秋季產品發表會亮點集結! Nov 14, 2023 pm 05:29 PM

易知微2023年秋季產品發表會已經圓滿結束了!讓我們一起回顧一下發表會的精彩亮點吧!一、智能普惠開放,讓數位孿生成為生產力袋鼠雲端聯合創辦人、易知微CEO寧海元開場致詞提出:在今年公司的戰略會上,我們把產品研發的主要方向定位成「智能普惠開放「三大核心能力,圍繞著「智慧普惠開放」這三大核心關鍵字,我們進一步提出「讓數位孿生成為生產力」的發展目標。二、EasyTwin:探索更易用的數位孿生新引擎1、從0.1到1.0,持續探索數位孿生融合渲染引擎有更優解以成熟的3D編輯模式、便捷的交互藍圖、海量的模型資產

Golang與大數據:完美搭配還是相反? Golang與大數據:完美搭配還是相反? Mar 05, 2024 pm 01:57 PM

Golang與大數據:完美搭配還是相反?隨著大數據技術的快速發展,越來越多的企業開始透過數據分析來優化業務和決策。對於大數據處理來說,高效率的程式語言是至關重要的。而在眾多程式語言中,Golang(Go語言)因其並發、高效、簡潔等特點,成為了大數據處理的熱門選擇之一。那麼,Golang與大數據究竟是完美搭配還是相悖呢?本文將從Golang在大數據處理上的應用、