利用下一代Hadoop YARN构建轻量级弹性计算平台
作者: Dong | 新浪微博: 西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明 网址:http://dongxicheng.org/mapreduce-nextgen/use-hadoop-yarn-to-build-a-cloud-system/ 本博客的文章集合:http://dongxicheng.org/recommend/ 重
作者:Dong | 新浪微博:西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址:http://dongxicheng.org/mapreduce-nextgen/use-hadoop-yarn-to-build-a-cloud-system/
本博客的文章集合:http://dongxicheng.org/recommend/
重大消息:我的Hadoop新书《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》已经开始在各大网站销售了,购书链接地址: 当当购书网址,京东购书网址,卓越购书网址。新书官方宣传主页: http://hadoop123.com/。
YARN(Yet Another Resource Negotiator)是下一代Hadoop的一个分支(注意:目前YARN尚不成熟稳定,各大公司普遍使用的还是Hadoop 1.0,但YARN是未来发展趋势,可以提前了解和学习它),它是一个资源管理系统,其上可以运行各种计算框架和应用程序,关于YARN,我已经在多篇文章中进行了介绍:
(1)”相比于MRv1,YARN带来的优势是什么?”
(2)”Hadoop 2.0中的基本术语解释”
(3)”浅谈Borg/YARN/Mesos/Torca/Corona一类系统”
(4)”多集群下资源共享方案介绍”
(5)”解析Google集群资源管理系统Omega”
更多文章可参考:下一代Hadoop YARN全面剖析。
YARN是未来的一个趋势,YARN本身已经变成了一个云操作系统,很多新的计算框架或者应用程序不再基于传统的操作系统开发(比如Linux),而是基于YARN这个云操作系统,YARN提供了资源管理和资源调度等机制,这意味着,很多新的计算框架或者应用程序脱离了YARN将不再可以单独运行,典型的代表是DAG计算框架Tez和Spark(Spark也可以运行在另一个与YARN类似的资源管理系统Mesos上)。
当前很多计算框架都开发了YARN版本,以能够直接运行在YARN上。本文进行简单的梳理。
(1) MapReduce:MapReduce是一个非常经典的离线计算框架,在MRv1中,MapReduce应用程序运行在由JobTracker和TaskTracker组成的运行时环境中,而在YARN中,不再有JobTracker和TaskTracker这样的服务组件,取而代之的是一个组件ApplicationMaster,它只负责应用程序相关的管理,比如任务切分和调度、任务监控和容错等,而资源相关的调度和管理交给YARN完成。
(2) Tez:Hortonworks开源的DAG计算框架,在MAPREDUCE基础上扩展而来的,重用了MapReduce大量代码,仅支持运行在YARN上,不可单独运行。Tez介绍可参考我的这篇文章:“Apache Tez:一个运行在YARN之上支持DAG作业的计算框架”。
(3)Storm:实时计算框架,运行时环境由Nimbus和supervisor等组件组成,目前storm团队正准备将其移植到YARN上(具体参考:storm plugin for Hadoop YARN:https://groups.google.com/forum/?fromgroups#!topic/storm-user/XBHCau0e5nA),而Yahoo甚至已经开源了一个简单的版本(具体见:https://github.com/yahoo/storm-yarn)。
(4)Spark:Spark是一个基于内存实现的MapReduce计算框架,某些应用场景下更加高效,它目前已经支持运行在YARN上(https://github.com/tweetmagik/spark-yarn)。
随着开源界的发展和推进,最终,YARN之上可以运行各种应用类型的计算框架,包括离线计算框架MapReduce,实时计算框架Storm,DAG计算框架Tez等,真正实现一个集群多用途,这样的集群或者系统,我们通常称为轻量级弹性计算平台,说它轻量级,是因为YARN采用了cgroups轻量级隔离方案,说它弹性,是因为YARN能根据各种计算框架或者应用的负载或者需求调整它们各自占用的资源,实现集群资源共享,资源弹性收缩。在不久的将来,普遍采用的部署方案应该如下:
当然,随着YARN朝着资源管理系统方向更好地发展,最终Impala和Hbase(Hbase已经在做了,参考:https://issues.apache.org/jira/browse/HBASE-4329)这种系统,均可以部署到YARN之上,这样,凡是跟计算沾边的系统均可以部署到YARN上。
原创文章,转载请注明: 转载自董的博客
本文链接地址: http://dongxicheng.org/mapreduce-nextgen/use-hadoop-yarn-to-build-a-cloud-system/
作者:Dong,作者介绍:http://dongxicheng.org/about/
本博客的文章集合:http://dongxicheng.org/recommend/
Copyright © 2013
This feed is for personal, non-commercial use only.
The use of this feed on other websites breaches copyright. If this content is not in your news reader, it makes the page you are viewing an infringement of the copyright. (Digital Fingerprint:
)

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Vous recherchez la distribution Linux parfaite pour donner une nouvelle vie à votre ordinateur ancien ou bas de gamme ? Si oui, alors vous êtes au bon endroit. Dans cet article, nous explorerons certains de nos meilleurs choix de distributions Linux légères spécialement conçues pour le matériel plus ancien ou moins puissant. Que la motivation derrière cela soit de faire revivre un appareil vieillissant ou simplement de maximiser les performances avec un budget limité, ces options légères feront certainement l'affaire. Pourquoi choisir une distribution Linux légère ? Il y a plusieurs avantages à choisir une distribution Linux légère, le premier étant d'obtenir les meilleures performances avec le moins de ressources système, ce qui les rend idéales pour les matériels plus anciens avec une puissance de traitement, une RAM et un espace de stockage limités. Au-delà, avec des ressources plus lourdes

Dans les deux premiers didacticiels de cette série, nous avons créé des pages personnalisées pour vous connecter et enregistrer de nouveaux utilisateurs. Désormais, il ne reste plus qu'une partie du flux de connexion à explorer et à remplacer : que se passe-t-il si un utilisateur oublie son mot de passe et souhaite réinitialiser son mot de passe WordPress ? Dans ce didacticiel, nous aborderons la dernière étape et compléterons le plugin de connexion personnalisé que nous avons construit tout au long de la série. La fonctionnalité de réinitialisation du mot de passe dans WordPress suit plus ou moins l'approche standard des sites Web actuels : l'utilisateur lance une réinitialisation en saisissant son nom d'utilisateur ou son adresse e-mail et en demandant à WordPress de réinitialiser son mot de passe. Créez un jeton de réinitialisation de mot de passe temporaire et stockez-le dans les données utilisateur. Un lien contenant ce token sera envoyé à l'adresse email de l'utilisateur. L'utilisateur clique sur le lien. Dans le lourd

Comment utiliser GitLab pour la gestion des documents de projet 1. Introduction générale Dans le processus de développement logiciel, les documents de projet sont des informations très importantes. Ils peuvent non seulement aider l'équipe de développement à comprendre les besoins et la conception du projet, mais également fournir une référence à l'équipe de test. et les clients. Afin de faciliter le contrôle de version et la collaboration en équipe sur les documents de projet, nous pouvons utiliser GitLab pour la gestion des documents de projet. GitLab est un système de contrôle de version basé sur Git. En plus de prendre en charge la gestion du code, il peut également gérer les documents de projet. 2. Configuration de l'environnement GitLab Tout d'abord, je

Golang (langage Go) est un langage de programmation développé par Google, visant à offrir une expérience de programmation efficace, concise, simultanée et légère. Il possède des fonctionnalités de concurrence intégrées et fournit aux développeurs des outils puissants pour fonctionner correctement dans des situations de concurrence élevée. Cet article examinera les raisons pour lesquelles Golang est adapté au traitement à haute concurrence et fournira des exemples de code spécifiques pour illustrer. Modèle de concurrence Golang Golang adopte un modèle de concurrence basé sur goroutine et canal. goro

ChatGPTJava : Comment créer un système intelligent de recommandation musicale, des exemples de code spécifiques sont nécessaires Introduction : Avec le développement rapide d'Internet, la musique est devenue un élément essentiel de la vie quotidienne des gens. Alors que les plateformes musicales continuent d’émerger, les utilisateurs sont souvent confrontés à un problème commun : comment trouver la musique qui correspond à leurs goûts ? Afin de résoudre ce problème, le système intelligent de recommandation musicale a vu le jour. Cet article explique comment utiliser ChatGPTJava pour créer un système intelligent de recommandation musicale et fournit des exemples de code spécifiques. Non.

Construction fluide : comment configurer correctement l'adresse de l'image Maven Lorsque vous utilisez Maven pour créer un projet, il est très important de configurer l'adresse de l'image correcte. Une configuration correcte de l'adresse miroir peut accélérer la construction du projet et éviter des problèmes tels que les retards du réseau. Cet article explique comment configurer correctement l'adresse du miroir Maven et donne des exemples de code spécifiques. Pourquoi avez-vous besoin de configurer l'adresse de l'image Maven ? Maven est un outil de gestion de projet qui peut automatiquement créer des projets, gérer les dépendances, générer des rapports, etc. Lors de la construction d'un projet dans Maven, généralement

En tant que plateforme sociale de vidéos courtes de renommée mondiale, Douyin a gagné la faveur d'un grand nombre d'utilisateurs grâce à son algorithme de recommandation personnalisé unique. Cet article approfondira la valeur et les principes de la recommandation vidéo Douyin pour aider les lecteurs à mieux comprendre et à utiliser pleinement cette fonctionnalité. 1. Qu'est-ce que la vidéo recommandée par Douyin ? La vidéo recommandée par Douyin utilise des algorithmes de recommandation intelligents pour filtrer et proposer du contenu vidéo personnalisé aux utilisateurs en fonction de leurs intérêts et de leurs habitudes comportementales. La plateforme Douyin analyse l'historique de visionnage des utilisateurs, le comportement des likes et des commentaires, les enregistrements de partage et d'autres données pour sélectionner et recommander les vidéos qui correspondent le mieux aux goûts des utilisateurs à partir d'une immense vidéothèque. Ce système de recommandation personnalisé améliore non seulement l'expérience utilisateur, mais aide également les utilisateurs à découvrir davantage de contenu vidéo correspondant à leurs préférences, améliorant ainsi la fidélité des utilisateurs et leur taux de rétention. à ceci

Guide des étapes de packaging du projet Maven : optimiser le processus de construction et améliorer l'efficacité du développement. À mesure que les projets de développement de logiciels deviennent de plus en plus complexes, l'efficacité et la rapidité de la construction du projet sont devenues des maillons importants du processus de développement qui ne peuvent être ignorés. En tant qu'outil de gestion de projet populaire, Maven joue un rôle clé dans la construction de projets. Ce guide explorera comment améliorer l'efficacité du développement en optimisant les étapes de packaging des projets Maven et fournira des exemples de code spécifiques. 1. Confirmez la structure du projet Avant de commencer à optimiser l'étape de packaging du projet Maven, vous devez d'abord confirmer.
