利用下一代Hadoop YARN构建轻量级弹性计算平台
作者: Dong | 新浪微博: 西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明 网址:http://dongxicheng.org/mapreduce-nextgen/use-hadoop-yarn-to-build-a-cloud-system/ 本博客的文章集合:http://dongxicheng.org/recommend/ 重
作者:Dong | 新浪微博:西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址:http://dongxicheng.org/mapreduce-nextgen/use-hadoop-yarn-to-build-a-cloud-system/
本博客的文章集合:http://dongxicheng.org/recommend/
重大消息:我的Hadoop新书《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》已经开始在各大网站销售了,购书链接地址: 当当购书网址,京东购书网址,卓越购书网址。新书官方宣传主页: http://hadoop123.com/。
YARN(Yet Another Resource Negotiator)是下一代Hadoop的一个分支(注意:目前YARN尚不成熟稳定,各大公司普遍使用的还是Hadoop 1.0,但YARN是未来发展趋势,可以提前了解和学习它),它是一个资源管理系统,其上可以运行各种计算框架和应用程序,关于YARN,我已经在多篇文章中进行了介绍:
(1)”相比于MRv1,YARN带来的优势是什么?”
(2)”Hadoop 2.0中的基本术语解释”
(3)”浅谈Borg/YARN/Mesos/Torca/Corona一类系统”
(4)”多集群下资源共享方案介绍”
(5)”解析Google集群资源管理系统Omega”
更多文章可参考:下一代Hadoop YARN全面剖析。
YARN是未来的一个趋势,YARN本身已经变成了一个云操作系统,很多新的计算框架或者应用程序不再基于传统的操作系统开发(比如Linux),而是基于YARN这个云操作系统,YARN提供了资源管理和资源调度等机制,这意味着,很多新的计算框架或者应用程序脱离了YARN将不再可以单独运行,典型的代表是DAG计算框架Tez和Spark(Spark也可以运行在另一个与YARN类似的资源管理系统Mesos上)。
当前很多计算框架都开发了YARN版本,以能够直接运行在YARN上。本文进行简单的梳理。
(1) MapReduce:MapReduce是一个非常经典的离线计算框架,在MRv1中,MapReduce应用程序运行在由JobTracker和TaskTracker组成的运行时环境中,而在YARN中,不再有JobTracker和TaskTracker这样的服务组件,取而代之的是一个组件ApplicationMaster,它只负责应用程序相关的管理,比如任务切分和调度、任务监控和容错等,而资源相关的调度和管理交给YARN完成。
(2) Tez:Hortonworks开源的DAG计算框架,在MAPREDUCE基础上扩展而来的,重用了MapReduce大量代码,仅支持运行在YARN上,不可单独运行。Tez介绍可参考我的这篇文章:“Apache Tez:一个运行在YARN之上支持DAG作业的计算框架”。
(3)Storm:实时计算框架,运行时环境由Nimbus和supervisor等组件组成,目前storm团队正准备将其移植到YARN上(具体参考:storm plugin for Hadoop YARN:https://groups.google.com/forum/?fromgroups#!topic/storm-user/XBHCau0e5nA),而Yahoo甚至已经开源了一个简单的版本(具体见:https://github.com/yahoo/storm-yarn)。
(4)Spark:Spark是一个基于内存实现的MapReduce计算框架,某些应用场景下更加高效,它目前已经支持运行在YARN上(https://github.com/tweetmagik/spark-yarn)。
随着开源界的发展和推进,最终,YARN之上可以运行各种应用类型的计算框架,包括离线计算框架MapReduce,实时计算框架Storm,DAG计算框架Tez等,真正实现一个集群多用途,这样的集群或者系统,我们通常称为轻量级弹性计算平台,说它轻量级,是因为YARN采用了cgroups轻量级隔离方案,说它弹性,是因为YARN能根据各种计算框架或者应用的负载或者需求调整它们各自占用的资源,实现集群资源共享,资源弹性收缩。在不久的将来,普遍采用的部署方案应该如下:
当然,随着YARN朝着资源管理系统方向更好地发展,最终Impala和Hbase(Hbase已经在做了,参考:https://issues.apache.org/jira/browse/HBASE-4329)这种系统,均可以部署到YARN之上,这样,凡是跟计算沾边的系统均可以部署到YARN上。
原创文章,转载请注明: 转载自董的博客
本文链接地址: http://dongxicheng.org/mapreduce-nextgen/use-hadoop-yarn-to-build-a-cloud-system/
作者:Dong,作者介绍:http://dongxicheng.org/about/
本博客的文章集合:http://dongxicheng.org/recommend/
Copyright © 2013
This feed is for personal, non-commercial use only.
The use of this feed on other websites breaches copyright. If this content is not in your news reader, it makes the page you are viewing an infringement of the copyright. (Digital Fingerprint:
)

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











오래된 컴퓨터나 저가형 컴퓨터에 새 생명을 불어넣을 완벽한 Linux 배포판을 찾고 계십니까? 그렇다면, 당신은 올바른 장소에 왔습니다. 이 기사에서는 오래되거나 덜 강력한 하드웨어에 맞게 특별히 맞춤화된 경량 Linux 배포판에 대한 최고의 선택 사항 중 일부를 살펴보겠습니다. 그 이면의 동기가 노후화된 장치를 되살리는 것이든 단순히 예산에 맞춰 성능을 극대화하는 것이든 이러한 경량 옵션은 확실히 그 비용에 적합합니다. 경량 Linux 배포판을 선택하는 이유는 무엇입니까? 경량 Linux 배포판을 선택하면 여러 가지 이점이 있습니다. 그 중 첫 번째는 최소한의 시스템 리소스에서 최고의 성능을 얻을 수 있다는 것입니다. 따라서 처리 능력, RAM 및 저장 공간이 제한된 구형 하드웨어에 이상적입니다. 그 외에도 더 많은 리소스를 집약적으로 사용하는 경우

이 시리즈의 처음 두 튜토리얼에서는 로그인 및 새 사용자 등록을 위한 사용자 정의 페이지를 구축했습니다. 이제 탐색하고 교체해야 할 로그인 흐름의 한 부분만 남았습니다. 사용자가 비밀번호를 잊어버렸고 WordPress 비밀번호를 재설정하려는 경우 어떻게 되나요? 이 튜토리얼에서는 마지막 단계를 다루고 시리즈 전반에 걸쳐 구축한 개인화된 로그인 플러그인을 완성하겠습니다. WordPress의 비밀번호 재설정 기능은 오늘날 웹사이트의 표준 접근 방식을 어느 정도 따릅니다. 사용자는 사용자 이름이나 이메일 주소를 입력하고 WordPress에 비밀번호 재설정을 요청하여 재설정을 시작합니다. 임시 비밀번호 재설정 토큰을 생성하여 사용자 데이터에 저장합니다. 이 토큰이 포함된 링크가 사용자의 이메일 주소로 전송됩니다. 사용자가 링크를 클릭합니다. 중요한

프로젝트 문서 관리를 위해 GitLab을 사용하는 방법 1. 배경 소개 소프트웨어 개발 프로세스에서 프로젝트 문서는 개발 팀이 프로젝트의 요구 사항과 설계를 이해하는 데 도움이 될 뿐만 아니라 테스트 팀에 참조를 제공할 수도 있습니다. 그리고 고객. 프로젝트 문서의 버전 관리 및 팀 협업을 용이하게 하기 위해 프로젝트 문서 관리에 GitLab을 사용할 수 있습니다. GitLab은 Git 기반의 버전 관리 시스템으로, 코드 관리 지원 외에도 프로젝트 문서 관리도 가능합니다. 2. GitLab 환경설정 먼저, 저는

Golang(Go 언어)은 효율적이고 간결하며 동시에 가벼운 프로그래밍 경험을 제공하기 위해 Google에서 개발한 프로그래밍 언어입니다. 동시성 기능이 내장되어 있으며 개발자에게 동시성이 높은 상황에서 제대로 작동할 수 있는 강력한 도구를 제공합니다. 이 기사에서는 Golang이 높은 동시성 처리에 적합한 이유를 살펴보고 설명할 구체적인 코드 예제를 제공합니다. Golang 동시성 모델 Golang은 고루틴과 채널을 기반으로 하는 동시성 모델을 채택합니다. 고로

원활한 빌드: Maven 이미지 주소를 올바르게 구성하는 방법 Maven을 사용하여 프로젝트를 빌드할 때 올바른 이미지 주소를 구성하는 것이 매우 중요합니다. 미러 주소를 올바르게 구성하면 프로젝트 구성 속도를 높이고 네트워크 지연과 같은 문제를 피할 수 있습니다. 이 기사에서는 Maven 미러 주소를 올바르게 구성하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. Maven 이미지 주소를 구성해야 하는 이유는 무엇입니까? Maven은 프로젝트 빌드, 종속성 관리, 보고서 생성 등을 자동으로 수행할 수 있는 프로젝트 관리 도구입니다. Maven으로 프로젝트를 빌드할 때 일반적으로

ChatGPTJava: 지능형 음악 추천 시스템을 구축하려면 구체적인 코드 예제가 필요합니다. 소개: 인터넷의 급속한 발전으로 음악은 사람들의 일상 생활에 없어서는 안 될 부분이 되었습니다. 음악 플랫폼이 계속 등장하면서 사용자들은 자신의 취향에 맞는 음악을 어떻게 찾을 수 있을까라는 공통적인 문제에 직면하는 경우가 많습니다. 이러한 문제를 해결하기 위해 지능형 음악 추천 시스템이 탄생했습니다. 이 기사에서는 ChatGPTJava를 사용하여 지능형 음악 추천 시스템을 구축하는 방법을 소개하고 특정 코드 예제를 제공합니다. 아니요.

세계적으로 유명한 단편 비디오 소셜 플랫폼인 Douyin은 고유한 개인화 추천 알고리즘으로 많은 사용자의 호감을 얻었습니다. 이 글에서는 독자들이 이 기능을 더 잘 이해하고 최대한 활용할 수 있도록 Douyin 비디오 추천의 가치와 원칙을 자세히 살펴보겠습니다. 1. Douyin 추천 비디오란 무엇입니까? Douyin 추천 비디오는 지능적인 추천 알고리즘을 사용하여 사용자의 관심사와 행동 습관을 기반으로 개인화된 비디오 콘텐츠를 필터링하고 푸시합니다. Douyin 플랫폼은 사용자의 시청 기록, 좋아요 및 댓글 동작, 공유 기록 및 기타 데이터를 분석하여 거대한 비디오 라이브러리에서 사용자의 취향에 가장 적합한 비디오를 선택하고 추천합니다. 이러한 개인화 추천 시스템은 사용자 경험을 향상시킬 뿐만 아니라, 사용자가 자신의 취향에 맞는 더 많은 영상 콘텐츠를 발견할 수 있도록 하여 사용자 충성도와 유지율을 향상시킵니다. 이것에

Maven 프로젝트 패키징 단계 가이드: 빌드 프로세스를 최적화하고 개발 효율성을 향상시킵니다. 소프트웨어 개발 프로젝트가 점점 더 복잡해짐에 따라 프로젝트 구성의 효율성과 속도는 개발 프로세스에서 무시할 수 없는 중요한 링크가 되었습니다. 널리 사용되는 프로젝트 관리 도구인 Maven은 프로젝트 구성에서 핵심적인 역할을 합니다. 이 가이드에서는 Maven 프로젝트의 패키징 단계를 최적화하여 개발 효율성을 향상시키는 방법을 살펴보고 구체적인 코드 예제를 제공합니다. 1. Maven 프로젝트 패키징 단계 최적화를 시작하기 전에 프로젝트 구조를 확인해야 합니다.
