目次
1. 作业提交
2. 作业初始化
3. 任务分配
4. 任务运行
5. 进度和状态更新
6. 作业完成

YARN作业运行机制

Jun 07, 2016 pm 04:38 PM
mapreduce yarn 手術 動作機構

在传统的MapReduce中, Jobtracker同时负责作业调度(将任务调度给对应的tasktracker)和任务进度管理(监控任务, 重启失败的或者速度比较慢的任务等). YARN中将Jobtracker的责任划分给两个独立的守护进程: 资源管理器(resource manager)负责管理集群的所有资源,


在传统的MapReduce中, Jobtracker同时负责作业调度(将任务调度给对应的tasktracker)和任务进度管理(监控任务, 重启失败的或者速度比较慢的任务等). YARN中将Jobtracker的责任划分给两个独立的守护进程: 资源管理器(resource manager)负责管理集群的所有资源, 应用管理器(application master)负责管理集群上任务的生命周期. 具体的做法是应用管理器向资源管理器提出资源需求, 以container为单位, 然后在这些container中运行该应用相关的进程. container由运行在集群节点上的节点管理器监控, 确保应用不会用超资源. 每个应用的实例, 亦即一个MapReduce作业都有一个自己的应用管理器.

综上所述, YARN中包括以下几个角色
  • 客户端, 向整个集群提交MapReduce作业
  • YARN资源管理器, 负责调度整个集群的计算资源
  • YARN节点管理器, 在集群的机器上启动以及监控container
  • MapReduce应用管理器, 调度某个作业的所有任务. 应用管理器和任务运行在container中, container由资源管理器调度, 由节点管理器管理.
  • 分布式文件系统, 通常是HDFS.

YARN中运行一个作业的流程如下图所示:

Screen Shot 2014-08-10 at 下午09.40.35

1. 作业提交


YARN中的提交作业的API和经典的MapReduce很像(第1步). 作业提交的过程和经典的MapReduce很像, 新的作业ID(应用ID)由资源管理器分配(第2步). 作业的客户端核实作业的输出, 计算输入的split, 将作业的资源(包括Jar包, 配置文件, split信息)拷贝给HDFS(第3步). 最后, 通过调用资源管理器的submitApplication()来提交作业(第4步).

2. 作业初始化


当资源管理器收到submitApplciation()的请求时, 就将该请求发给调度器(scheduler), 调度器分配container, 然后资源管理器在该container内启动应用管理器进程, 由节点管理器监控(第5a和5b步).

MapReduce作业的应用管理器是一个主类为MRAppMaster的Java应用. 其通过创造一些bookkeeping对象来监控作业的进度, 得到任务的进度和完成报告(第6步). 然后其通过分布式文件系统得到由客户端计算好的输入split(第7步). 然后为每个输入split创建一个map任务, 根据mapreduce.job.reduces创建reduce任务对象.

然后应用管理器决定如何运行构成整个作业的任务. 如果作业很小, 应用管理器会选择在其自己的JVM中运行任务, 这种作业称作是被unerized, 或者是以uber task的方式运行. 在任务运行之前, 作业的setup方法被调用来创建输出路径. 与MapRuduce 1中该方法由tasktracker运行的一个任务调用不同, 在YARN中是由应用管理器调用的.

3. 任务分配


如果不是小作业, 那么应用管理器向资源管理器请求container来运行所有的map和reduce任务(第8步). 这些请求是通过心跳来传输的, 包括每个map任务的数据位置, 比如存放输入split的主机名和机架(rack). 调度器利用这些信息来调度任务, 尽量将任务分配给存储数据的节点, 或者退而分配给和存放输入split的节点相同机架的节点.

请求也包括了任务的内存需求, 默认情况下map和reduce任务的内存需求都是1024MB. 可以通过mapreduce.map.memory.mb和mapreduce.reduce.memory.mb来配置.

分配内存的方式和MapReduce 1中不一样, MapReduce 1中每个tasktracker有固定数量的slot, slot是在集群配置是设置的, 每个任务运行在一个slot中, 每个slot都有最大内存限制, 这也是整个集群固定的. 这种方式很不灵活.

在YARN中, 资源划分的粒度更细. 应用的内存需求可以介于最小内存和最大内存之间, 并且必须是最小内存的倍数.

4. 任务运行


当一个任务由资源管理器的调度器分配给一个container后, 应用管理器通过练习节点管理器来启动container(第9a步和9b步). 任务有一个主类为YarnChild的Java应用执行. 在运行任务之前首先本地化任务需要的资源, 比如作业配置, JAR文件, 以及分布式缓存的所有文件(第10步). 最后, 运行map或reduce任务(第11步).

YarnChild运行在一个专用的JVM中, 但是YARN不支持JVM重用.

5. 进度和状态更新


YARN中的任务将其进度和状态(包括counter)返回给应用管理器, 后者通过每3秒的脐带接口有整个作业的视图(view). 这和MapRduce 1不太一样, 后者的进度流从tasktracker到jobtracker. 下图为MapReduce 2中的进度更新流:

Screen Shot 2014-08-10 at 下午09.40.27

客户端每秒(通过mapreduce.client.progressmonitor.pollinterval设置)向应用管理器请求进度更新, 展示给用户.

在MapReduce 1中, jobtracker的UI有运行的任务列表及其对应的进度. 在YARN中, 资源管理器的UI展示了所有的应用以及各自的应用管理器的UI.

6. 作业完成


除了向应用管理器请求作业进度外, 客户端每5分钟都会通过调用waitForCompletion()来检查作业是否完成. 时间间隔可以通过mapreduce.client.completion.pollinterval来设置.

作业完成之后, 应用管理器和container会清理工作状态, OutputCommiter的作业清理方法也会被调用. 作业的信息会被作业历史服务器存储以备之后用户核查.

参考文献:

[1]. Hadoop: The Definitive Guide. 3rd Edition. Chapter 6, YARN.

485 total views, no views today

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

JavaScript パッケージマネージャーの比較: Npm vs Yarn vs Pnpm JavaScript パッケージマネージャーの比較: Npm vs Yarn vs Pnpm Aug 09, 2022 pm 04:22 PM

この記事では、3 つの JavaScript パッケージ マネージャー (npm、yarn、pnpm) について説明し、これら 3 つのパッケージ マネージャーを比較し、npm、yarn、pnpm の違いと関係について説明します。助けてください。質問がある場合は、指摘してください。

JS パッケージ管理ツール:yarn を簡単に分析した記事 JS パッケージ管理ツール:yarn を簡単に分析した記事 Aug 09, 2022 pm 03:49 PM

Yarn も npm と同じく JavaScript のパッケージ管理ツールですが、この記事では、yarn のパッケージ管理ツールについて紹介します。

PHPコアの動作メカニズムと実装原理の詳細な説明 PHPコアの動作メカニズムと実装原理の詳細な説明 Nov 08, 2023 pm 01:15 PM

PHP は、Web 開発で頻繁に使用される、人気のあるオープン ソースのサーバー側スクリプト言語です。動的データを処理し、HTML 出力を制御できますが、これを実現するにはどうすればよいでしょうか?次に、この記事では、PHP の中核となる動作メカニズムと実装原理を紹介し、具体的なコード例を使用してその動作プロセスを詳しく説明します。 PHP ソース コードの解釈 PHP ソース コードは C 言語で書かれたプログラムです。コンパイル後、実行可能ファイル php.exe が生成されます。Web 開発で使用される PHP の場合、通常は A を通じて実行されます。

徹底分析:Go言語のゴルーチンの本質と動作仕組み 徹底分析:Go言語のゴルーチンの本質と動作仕組み Mar 12, 2024 pm 03:39 PM

Go 言語では、ゴルーチンはコードの断片を同時に実行するために使用される軽量のスレッドです。従来のスレッドと比較して、ゴルーチンはより効率的で、メモリ消費量が少なく、起動速度が速くなります。この記事では、Go 言語のゴルーチンの性質と動作メカニズムを深く分析し、読者の理解を深めるために具体的なコード例を示します。 1. Goroutine の本質 Go 言語では、Goroutine は Go ランタイムによって管理される軽量オブジェクトです。

Xuexitong の宿題が拒否された場合、どうすれば再提出できますか? -Xuexuetong の章を学習した回数を確認するにはどうすればよいですか? Xuexitong の宿題が拒否された場合、どうすれば再提出できますか? -Xuexuetong の章を学習した回数を確認するにはどうすればよいですか? Mar 18, 2024 pm 08:49 PM

Xuexitong の宿題が拒否された場合、どうすれば再提出できますか? 1. 割り当てがキャンセルされたという通知を見つけます。 2. 返されたジョブに関する情報を見つけます。 3. 青色の課題をクリックして、課題を再変更して送信します。 Xuexuetong の章を学習した回数を確認するにはどうすればよいですか?まず、Xuedutong と入力し、右下の「Me」をクリックします。次に、個人名の横に小さなロゴがあるので、それをクリックします。最後に、記号をクリックすると、Xuetong の使用回数が表示されます。

Xuexitong の宿題が拒否された場合、どうすれば再提出できますか? -Xuexuetong の動画を視聴するにはどうすればよいですか? Xuexitong の宿題が拒否された場合、どうすれば再提出できますか? -Xuexuetong の動画を視聴するにはどうすればよいですか? Mar 18, 2024 pm 05:55 PM

XueTong は、神経系の原理に基づいた国内の知識普及および管理共有プラットフォームです。潮興が過去 20 年間に蓄積した膨大な書籍、雑誌、新聞、ビデオ、オリジナルなどのリソースを活用し、知識管理、コース学習、特別トピックの作成を統合して、読者にワンストップの学習と作業を提供します。環境。オンライン コースを学習するときに、多くの学生がこの問題に遭遇します。宿題を間違えた場合、やり直す必要がある場合、どうやって提出すればよいでしょうか。今日は、Xuexuetongの宿題が却下された後に再提出する方法と、Xuexuetongのビデオを視聴する方法を編集者が説明しましょう。 1. 拒否されたXuexitong課題を再提出する方法 ステップ1: Xuexitongソフトウェアを開いた後、ホームページで「コース」をクリックします ステップ2: コースリストで、返却されたコース課題「拒否されたコース」を見つけますクリック

React インストール ヤーンが内部コマンドではないことを報告し続ける場合はどうすればよいですか? React インストール ヤーンが内部コマンドではないことを報告し続ける場合はどうすればよいですか? Jan 04, 2023 am 09:24 AM

React インストール ヤーンが内部コマンドではないことを報告し続ける問題の解決策: 1. コマンド「pm uninstallyarn -g」を使用してyarnをアンインストールします; 2. 「npm installyarn」を使用してyarnを再インストールします; 3. 「」を追加します。 C:\ WINDOWS\system32\node_modules\yarn\bin"; 4. cmd を再度開き、「yarn -v」コマンドを実行します。

Swoole のコルーチンの動作メカニズムを調べる Swoole のコルーチンの動作メカニズムを調べる Jun 13, 2023 am 10:27 AM

SwooleはPHPをベースにしたコルーチンフレームワークであり、非同期IO性能が優れています。 Swoole のコアはコルーチンです。コルーチンはスレッドよりも軽量な同時実行メカニズムであり、同じスレッド内でタスクを切り替えて同時実行を実現できます。この記事では、Swoole のコルーチンの動作メカニズムについて説明します。 1. コルーチンの概念 コルーチンはマイクロスレッドとしても知られ、スレッドよりもきめの細かい同時実行メカニズムです。コルーチンとスレッドの違いは、コルーチンはタイム スライスのローテーションを通じてタスクの切り替えを実装するのに対し、スレッドはオペレーティング システムのスケジューラによって切り替えられることです。

See all articles