首頁 常見問題 Hadoop是用於分散式運算的,它是什麼東西

Hadoop是用於分散式運算的,它是什麼東西

Nov 18, 2019 pm 02:01 PM
hadoop

Hadoop是用於分散式運算的,它是什麼東西

hadoop是什麼?

(1)Hadoop是一個開源的框架,可編寫和運行分散式應用程式處理大規模數據,是專為離線和大規模數據分析而設計的,並不適合那種對幾個記錄隨機讀寫的線上事務處理模式。         ( 推薦學習:web前端視訊教學

Hadoop=HDFS(檔案系統,資料儲存技術相關) Mapreduce(資料處理),Hadoop的資料來源可以是任何形式,在處理半結構化和非結構化資料上與關係型資料庫相比有更好的性能,具有更靈活的處理能力,不管任何資料形式最終會轉化為key/value,key/value是基本資料單元。

用函數式變成Mapreduce取代SQL,SQL是查詢語句,而Mapreduce則是使用腳本和程式碼,而對於適用於關係型資料庫,習慣SQL的Hadoop有開源工具hive取代。

(2)Hadoop就是一個分散式運算的解.

#hadoop能做什麼?

hadoop擅長日誌分析,facebook就用Hive來進行日誌分析,2009年時facebook就有非編程人員的30%的人使用HiveQL進行數據分析;

#淘寶搜尋中  的自訂篩選也使用的Hive;利用Pig還可以做進階的資料處理,包括Twitter、LinkedIn 上用於發現您可能認識的人,可以實現類似Amazon.com的協同過濾的推薦效果。

淘寶的商品推薦也是!在Yahoo!的40%的Hadoop作業是用pig運行的,包括垃圾郵件的識別和過濾,還有用戶特徵建模。

Hadoop 由許多元素組成。

其最底部是 Hadoop Distributed File System(HDFS),它儲存 Hadoop 叢集中所有儲存節點上的檔案。

HDFS的上一層是MapReduce 引擎,由 JobTrackers 和 TaskTrackers 組成。透過Hadoop分散式運算平台最核心的分散式檔案系統HDFS、MapReduce處理過程,以及資料倉儲工具Hive和分散式資料庫Hbase的介紹,基本上涵蓋了Hadoop分散式平台的所有技術核心。

以上是Hadoop是用於分散式運算的,它是什麼東西的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱門文章

倉庫:如何復興隊友
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱門文章

倉庫:如何復興隊友
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱門文章標籤

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Java錯誤:Hadoop錯誤,如何處理與避免 Java錯誤:Hadoop錯誤,如何處理與避免 Jun 24, 2023 pm 01:06 PM

Java錯誤:Hadoop錯誤,如何處理與避免

在Beego中使用Hadoop和HBase進行大數據儲存和查詢 在Beego中使用Hadoop和HBase進行大數據儲存和查詢 Jun 22, 2023 am 10:21 AM

在Beego中使用Hadoop和HBase進行大數據儲存和查詢

如何使用PHP和Hadoop進行大數據處理 如何使用PHP和Hadoop進行大數據處理 Jun 19, 2023 pm 02:24 PM

如何使用PHP和Hadoop進行大數據處理

探索Java在大數據領域的應用:Hadoop、Spark、Kafka等技術堆疊的了解 探索Java在大數據領域的應用:Hadoop、Spark、Kafka等技術堆疊的了解 Dec 26, 2023 pm 02:57 PM

探索Java在大數據領域的應用:Hadoop、Spark、Kafka等技術堆疊的了解

linux下安裝Hadoop的方法是什麼 linux下安裝Hadoop的方法是什麼 May 18, 2023 pm 08:19 PM

linux下安裝Hadoop的方法是什麼

PHP中的資料處理引擎(Spark, Hadoop等) PHP中的資料處理引擎(Spark, Hadoop等) Jun 23, 2023 am 09:43 AM

PHP中的資料處理引擎(Spark, Hadoop等)

hadoop三大核心元件介紹 hadoop三大核心元件介紹 Mar 13, 2024 pm 05:54 PM

hadoop三大核心元件介紹

使用寶塔面板搭建Hadoop、Spark等大數據平台 使用寶塔面板搭建Hadoop、Spark等大數據平台 Jun 21, 2023 am 10:34 AM

使用寶塔面板搭建Hadoop、Spark等大數據平台