利用下一代Hadoop YARN构建轻量级弹性计算平台
作者: Dong | 新浪微博: 西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明 网址:http://dongxicheng.org/mapreduce-nextgen/use-hadoop-yarn-to-build-a-cloud-system/ 本博客的文章集合:http://dongxicheng.org/recommend/ 重
作者:Dong | 新浪微博:西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址:http://dongxicheng.org/mapreduce-nextgen/use-hadoop-yarn-to-build-a-cloud-system/
本博客的文章集合:http://dongxicheng.org/recommend/
重大消息:我的Hadoop新书《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》已经开始在各大网站销售了,购书链接地址: 当当购书网址,京东购书网址,卓越购书网址。新书官方宣传主页: http://hadoop123.com/。
YARN(Yet Another Resource Negotiator)是下一代Hadoop的一个分支(注意:目前YARN尚不成熟稳定,各大公司普遍使用的还是Hadoop 1.0,但YARN是未来发展趋势,可以提前了解和学习它),它是一个资源管理系统,其上可以运行各种计算框架和应用程序,关于YARN,我已经在多篇文章中进行了介绍:
(1)”相比于MRv1,YARN带来的优势是什么?”
(2)”Hadoop 2.0中的基本术语解释”
(3)”浅谈Borg/YARN/Mesos/Torca/Corona一类系统”
(4)”多集群下资源共享方案介绍”
(5)”解析Google集群资源管理系统Omega”
更多文章可参考:下一代Hadoop YARN全面剖析。
YARN是未来的一个趋势,YARN本身已经变成了一个云操作系统,很多新的计算框架或者应用程序不再基于传统的操作系统开发(比如Linux),而是基于YARN这个云操作系统,YARN提供了资源管理和资源调度等机制,这意味着,很多新的计算框架或者应用程序脱离了YARN将不再可以单独运行,典型的代表是DAG计算框架Tez和Spark(Spark也可以运行在另一个与YARN类似的资源管理系统Mesos上)。
当前很多计算框架都开发了YARN版本,以能够直接运行在YARN上。本文进行简单的梳理。
(1) MapReduce:MapReduce是一个非常经典的离线计算框架,在MRv1中,MapReduce应用程序运行在由JobTracker和TaskTracker组成的运行时环境中,而在YARN中,不再有JobTracker和TaskTracker这样的服务组件,取而代之的是一个组件ApplicationMaster,它只负责应用程序相关的管理,比如任务切分和调度、任务监控和容错等,而资源相关的调度和管理交给YARN完成。
(2) Tez:Hortonworks开源的DAG计算框架,在MAPREDUCE基础上扩展而来的,重用了MapReduce大量代码,仅支持运行在YARN上,不可单独运行。Tez介绍可参考我的这篇文章:“Apache Tez:一个运行在YARN之上支持DAG作业的计算框架”。
(3)Storm:实时计算框架,运行时环境由Nimbus和supervisor等组件组成,目前storm团队正准备将其移植到YARN上(具体参考:storm plugin for Hadoop YARN:https://groups.google.com/forum/?fromgroups#!topic/storm-user/XBHCau0e5nA),而Yahoo甚至已经开源了一个简单的版本(具体见:https://github.com/yahoo/storm-yarn)。
(4)Spark:Spark是一个基于内存实现的MapReduce计算框架,某些应用场景下更加高效,它目前已经支持运行在YARN上(https://github.com/tweetmagik/spark-yarn)。
随着开源界的发展和推进,最终,YARN之上可以运行各种应用类型的计算框架,包括离线计算框架MapReduce,实时计算框架Storm,DAG计算框架Tez等,真正实现一个集群多用途,这样的集群或者系统,我们通常称为轻量级弹性计算平台,说它轻量级,是因为YARN采用了cgroups轻量级隔离方案,说它弹性,是因为YARN能根据各种计算框架或者应用的负载或者需求调整它们各自占用的资源,实现集群资源共享,资源弹性收缩。在不久的将来,普遍采用的部署方案应该如下:
当然,随着YARN朝着资源管理系统方向更好地发展,最终Impala和Hbase(Hbase已经在做了,参考:https://issues.apache.org/jira/browse/HBASE-4329)这种系统,均可以部署到YARN之上,这样,凡是跟计算沾边的系统均可以部署到YARN上。
原创文章,转载请注明: 转载自董的博客
本文链接地址: http://dongxicheng.org/mapreduce-nextgen/use-hadoop-yarn-to-build-a-cloud-system/
作者:Dong,作者介绍:http://dongxicheng.org/about/
本博客的文章集合:http://dongxicheng.org/recommend/
Copyright © 2013
This feed is for personal, non-commercial use only.
The use of this feed on other websites breaches copyright. If this content is not in your news reader, it makes the page you are viewing an infringement of the copyright. (Digital Fingerprint:
)

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

正在尋找完美的Linux發行版,為舊的或低階電腦注入新的活力嗎?如果是的話,那麼你來對地方了。在本文中,我們將探索一些輕量級Linux發行版的首選,這些發行版是專門為較舊或功能較弱的硬體量身定做的。無論這樣做背後的動機是重振老舊的設備,還是只是在預算內最大化性能,這些輕量級選項肯定能滿足需求。為什麼要選擇輕量級的Linux發行版?選擇輕量級Linux發行版有幾個優點,第一個優點是在最少的系統資源上獲得最佳效能,這使得它們非常適合處理能力、RAM和儲存空間有限的舊硬體。除此之外,與較重的資源密集

如何利用GitLab進行專案文件管理一、背景介紹在軟體開發過程中,專案文件是非常重要的資料,不僅能夠幫助開發團隊了解專案的需求和設計,還能提供給測試團隊和客戶參考。為了方便專案文件的版本控制和團隊協作,我們可以利用GitLab來進行專案文件管理。 GitLab是一個基於Git的版本控制系統,除了支援程式碼管理,還可以管理專案文件。二、GitLab環境建置首先,我

在本系列的前兩個教學中,我們建立了用於登入和註冊新使用者的自訂頁面。現在,登入流程中只剩下一個部分需要探索和替換:如果使用者忘記密碼並想要重設WordPress密碼,會發生什麼事?在本教程中,我們將解決最後一步並完成我們在整個系列中建立的個人化登入外掛程式。 WordPress中的密碼重設功能或多或少遵循當今網站上的標準方法:使用者透過輸入使用者名稱或電子郵件地址並要求WordPress重設密碼來啟動重設。建立臨時密碼重設令牌並將其儲存在使用者資料中。包含此令牌的連結將發送到使用者的電子郵件地址。用戶點擊連結。在重

Golang(Go語言)是一種由Google開發的程式語言,旨在提供高效、簡潔、並發和輕量級的程式設計體驗。它內建了並發特性,為開發者提供了強大的工具,使其在處理高並發情況下表現優異。本文將深入探討Golang為何適用於高並發處理的原因,並提供具體的程式碼範例加以說明。 Golang並發模型Golang採用了基於goroutine和channel的並發模型。 goro

ChatGPTJava:如何建立一個智慧音樂推薦系統,需要具體程式碼範例引言:隨著網路的快速發展,音樂成為人們日常生活中不可或缺的一部分。而隨著音樂平台的不斷湧現,使用者經常面臨一個共同的問題:如何找到符合自己口味的音樂?為了解決這個問題,智慧音樂推薦系統應運而生。本文將介紹如何使用ChatGPTJava建立智慧音樂推薦系統,並提供具體程式碼範例。第

建置流暢無阻:如何正確配置Maven鏡像位址在使用Maven建置專案時,配置正確的鏡像位址是非常重要的。正確配置鏡像位址可以加快專案建置的速度,避免網路延遲等問題。本文將介紹如何正確配置Maven鏡像位址,並給出特定的程式碼範例。為什麼需要設定Maven鏡像位址Maven是專案管理工具,可以自動化建置專案、管理依賴、產生報表等。在Maven建置專案時,通常

抖音作為一個全球知名的短視頻社交平台,靠著其獨特的個人化推薦演算法贏得了廣大用戶的青睞。本文將深入研究抖音影片推薦的價值和原理,幫助讀者更了解並充分利用這項功能。一、什麼是抖音推薦影片抖音推薦影片是根據用戶的興趣和行為習慣,利用智慧推薦演算法為用戶篩選和推送個人化影片內容。抖音平台透過分析用戶的觀看歷史、按讚和評論行為、分享記錄等數據,從龐大的影片庫中精選出最符合用戶口味的影片進行推薦。這種個人化推薦系統不僅提高了用戶體驗,也幫助用戶發現更多符合其喜好的影片內容,從而增強用戶黏性和留存率。在這個

Maven專案打包步驟指南:優化建置流程,提高開發效率隨著軟體開發專案變得越來越複雜,專案建置的效率和速度成為了開發過程中不可忽視的重要環節。作為一種流行的專案管理工具,Maven在專案建置中扮演了關鍵角色。本指南將探討如何透過優化Maven專案的打包步驟,提高開發效率,並提供具體的程式碼範例。 1.確認專案結構在開始優化Maven專案打包步驟前,首先需要確
