Maison base de données tutoriel mysql Hadoop层级队列组织方式

Hadoop层级队列组织方式

Jun 07, 2016 pm 04:29 PM
hadoop auteur Hiérarchie 新浪 方式 organiser 队列

作者: Dong | 新浪微博: 西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明 网址:http://dongxicheng.org/mapreduce/hadoop-hierarchy-queues/ 在Hadoop 0.20.x版本或者更早的版本,Hadoop采用了平级队列组织方式,在这种组织方

在Hadoop 0.20.x版本或者更早的版本,Hadoop采用了平级队列组织方式,在这种组织方式中,管理员可将用户分到若干个扁平队列中,在每个队列中,可指定一个或几个队列管理员管理这些用户,比如杀死任意用户的作业,修改任意用户作业的优先级。然而,从资源管理角度看,仅仅按照队列组织用户是不够的,还需要将资源划分到这几个队列中,并按照一定的策略完成资源分配,这就需要Hadoop作业调度器的支持。总之,在Hadoop中,队列的组织是队列管理和资源分配的基础。

随着Hadoop应用越来越广泛,有用户提出需支持层级队列组织方式。典型的应用场景如下:在一个Hadoop集群中,管理员将所有计算资源划分给了若干个队列,每个队列对应了一个“组织”,其中有一个组织“Org1”,它分到了60%的资源,它内部包含3中类型的作业:

(1)产品线作业

(2)实验性作业—分属于三个不用的项目:Proj1,Proj2和Proj3

(3)其他类型作业

Org1管理员想更有效地控制这60%资源,比如将大部分资源分配给产品线作业的同时,能够让实验性作业和其他类型作业有最少资源保证。考虑到产品线作业提交频率很低,当有产品线作业提交时,必须第一时间得到资源,剩下的资源才给其他类型的作业,然而,一旦产品线作业运行结束,实验性作业和其他类型作业必须马上获取未使用的资源,一个可能的配置方式如下:

grid {
Org1 min=60% {
priority min=90% {
production min=82%
proj1 min=6% max=10%
proj2 min=6%
proj3 min=6%
}
miscellaneous min=10%
}
Org2 min=40%
}
Copier après la connexion

这就引出来层级队列组织方式。

(1) 子队列

1)? 队列可以嵌套,每个队列均可以包含子队列。

2)? 用户只能将作业提交到最底层的队列,即叶子队列。

(2)最少容量

1)每个子队列均有一个“最少容量比”属性,表示可以使用父队列的容量的百分比

2)调度器总是优先选择当前资源使用率最低的队列,并为之分配资源。比如同级的两个队列Q1和Q2,他们的最少容量均为30,而Q1已使用10,Q2已使用12,则调度器会优先将资源分配给Q1。

3)最少容量不是“总会保证的最低容量”,也就是说,如果一个队列的最少容量为20,而该队列中所有队列仅使用了5,那么剩下的15可能会分配给其他需要的队列。

4)最少容量的值为不小于0的数,但也不能大于“最大容量”。

(3最大容量

1)? 为了防止一个队列超量使用资源,可以为队列设置一个最大容量,这是一个资源使用上限,任何时刻使用的资源总量不能超过该值。

2) 默认情况下队列的最大容量是无限大,这意味着,当一个队列只分配了20%的资源,所有其他队列没有作业时,该队列可能使用100%的资源,当其他队列有作业提交时,再逐步归还。

如何将一个队列中的资源分配给它的各个子队列?

当一个TaskTracker发送心跳请求一个新任务时,调度器会按照以下策略为之选择任务:

1)? 按照 比值{used capacity}/{minimum-capaity},对所有子队列排序;

2)? 选择一个比值{used capacity}/{minimum-capaity}最小的队列:

如果是一个叶子队列,且有处于pending状态的任务,则选择一个任务(不能超过maximum capacity);

否则,递归地从这个队列的子队列中选择任务。

3)? 如果没有找到任务,则查看下一个队列。

层级队列组织方式在 0.21.x和0.22.x中引入,但仅有Capacity Scheduler支持该组织方式(https://issues.apache.org/jira/browse/MAPREDUCE-824 ),当然,最新的YARN(Hadoop 0.23.x和2.0.x-alpha)也为Fair Scheduler增加了层级队列的支持,具体参考:https://issues.apache.org/jira/browse/YARN-187。

如何配置?

以0.21.x为例,管理员可在配置文件mapred-queues.xml中配置层级队列,配置方式如下:

<queues>
<queue>
<name>Org1</name>
<queue>
<name>production</name>
<properties>
<property key="”capacity”" value="”20″/">
<property key="”" maximum-capacity value="”20″/">
<property key="”supports-priority”" value="”true”/">
<property key="”minimum-user-limit-percent”" value="”30″/">
<property key="”maximum-initialized-jobs-per-user”" value="”10″/">
<property key="”user-limit”" value="”30″/">
</property></property></property></property></property></property></properties>
</queue>
<queue>
<name>miscellaneous</name>
<properties>
<property key="”capacity”" value="”10″/">
<property key="”" maximum-capacity value="”20″/">
<property key="”user-limit”" value="”20″/">
</property></property></property></properties>
</queue>
。。。。。。。
</queue></queues>
Copier après la connexion

管理员可在capacity-scheduler.xml中设置一些参数的默认值和Capacity独有的配置:

<configuration>
<property>
<name>mapred.capacity-scheduler.default-supports-priority</name>
<value>false</value>
</property>
<property>
<name>mapred.capacity-scheduler.default-minimum-user-limit-percent</name>
<value>100</value>
</property>
<property>
<name>mapred.capacity-scheduler.default-maximum-initialized-jobs-per-user</name>
<value>2</value>
</property>
<property>
<name>mapred.capacity-scheduler.init-poll-interval</name>
<value>5000</value>
</property>
<property>
<name>mapred.capacity-scheduler.init-worker-threads</name>
<value>5</value>
</property>
</configuration>
Copier après la connexion

原创文章,转载请注明: 转载自董的博客

本文链接地址: http://dongxicheng.org/mapreduce/hadoop-hierarchy-queues/

作者:Dong,作者介绍:http://dongxicheng.org/about/


Copyright © 2012
This feed is for personal, non-commercial use only.
The use of this feed on other websites breaches copyright. If this content is not in your news reader, it makes the page you are viewing an infringement of the copyright. (Digital Fingerprint:
)
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Tutoriel Java
1662
14
Tutoriel PHP
1263
29
Tutoriel C#
1236
24
Application de la technologie de file d'attente au délai de message et aux nouvelles tentatives de message en PHP et MySQL Application de la technologie de file d'attente au délai de message et aux nouvelles tentatives de message en PHP et MySQL Oct 15, 2023 pm 02:26 PM

Application de la technologie de file d'attente au délai de message et aux nouvelles tentatives de message dans PHP et MySQL Résumé : Avec le développement continu des applications Web, la demande de traitement hautement simultané et de fiabilité du système devient de plus en plus élevée. En tant que solution, la technologie de file d'attente est largement utilisée dans PHP et MySQL pour implémenter des fonctions de délai de message et de nouvelle tentative de message. Cet article présentera l'application de la technologie de file d'attente dans PHP et MySQL, y compris les principes de base des files d'attente, les méthodes d'utilisation des files d'attente pour implémenter le délai de message et les méthodes d'utilisation des files d'attente pour implémenter les nouvelles tentatives de message, et donnera

Stratégies d'analyse et d'optimisation des performances des files d'attente Java Queue Stratégies d'analyse et d'optimisation des performances des files d'attente Java Queue Jan 09, 2024 pm 05:02 PM

Analyse des performances et stratégie d'optimisation de JavaQueue Résumé de la file d'attente : La file d'attente (file d'attente) est l'une des structures de données couramment utilisées en Java et est largement utilisée dans divers scénarios. Cet article abordera les problèmes de performances des files d'attente JavaQueue sous deux aspects : l'analyse des performances et les stratégies d'optimisation, et donnera des exemples de code spécifiques. Introduction La file d'attente est une structure de données premier entré, premier sorti (FIFO) qui peut être utilisée pour implémenter le mode producteur-consommateur, la file d'attente des tâches du pool de threads et d'autres scénarios. Java fournit une variété d'implémentations de files d'attente, telles que Arr

Plan d'implémentation de la surveillance des tâches de file d'attente et de la planification des tâches en PHP et MySQL Plan d'implémentation de la surveillance des tâches de file d'attente et de la planification des tâches en PHP et MySQL Oct 15, 2023 am 09:15 AM

Implémentation de la surveillance des tâches de file d'attente et de la planification des tâches dans PHP et MySQL Introduction Dans le développement d'applications Web modernes, la file d'attente de tâches est une technologie très importante. Grâce aux files d'attente, nous pouvons mettre en file d'attente certaines tâches qui doivent être exécutées en arrière-plan et contrôler le temps d'exécution et l'ordre des tâches grâce à la planification des tâches. Cet article présentera comment implémenter la surveillance et la planification des tâches dans PHP et MySQL, et fournira des exemples de code spécifiques. 1. Principe de fonctionnement de la file d'attente La file d'attente est une structure de données premier entré, premier sorti (FIFO) qui peut être utilisée pour

Quel est le principe et la mise en œuvre du système de file d'attente de courrier PHP ? Quel est le principe et la mise en œuvre du système de file d'attente de courrier PHP ? Sep 13, 2023 am 11:39 AM

Quel est le principe et la mise en œuvre du système de file d'attente de courrier PHP ? Avec le développement d’Internet, le courrier électronique est devenu l’un des moyens de communication indispensables dans la vie quotidienne et professionnelle des gens. Cependant, à mesure que l'entreprise se développe et que le nombre d'utilisateurs augmente, l'envoi direct d'e-mails peut entraîner une dégradation des performances du serveur, un échec de livraison des e-mails et d'autres problèmes. Pour résoudre ce problème, vous pouvez utiliser un système de file d'attente de messagerie pour envoyer et gérer des e-mails via une file d'attente série. Le principe de mise en œuvre du système de file d'attente de courrier est le suivant : Lorsque le courrier est mis en file d'attente, lorsqu'il est nécessaire d'envoyer le courrier, il ne l'est plus directement

Explorez l'application de Java dans le domaine du big data : compréhension de Hadoop, Spark, Kafka et d'autres piles technologiques Explorez l'application de Java dans le domaine du big data : compréhension de Hadoop, Spark, Kafka et d'autres piles technologiques Dec 26, 2023 pm 02:57 PM

Pile technologique Java Big Data : Comprendre l'application de Java dans le domaine du Big Data, comme Hadoop, Spark, Kafka, etc. Alors que la quantité de données continue d'augmenter, la technologie Big Data est devenue un sujet brûlant à l'ère d'Internet d'aujourd'hui. Dans le domaine du big data, on entend souvent les noms de Hadoop, Spark, Kafka et d’autres technologies. Ces technologies jouent un rôle essentiel et Java, en tant que langage de programmation largement utilisé, joue également un rôle majeur dans le domaine du Big Data. Cet article se concentrera sur l'application de Java en général

Comment implémenter des modèles de producteur et de consommateur de files d'attente dans PHP et MySQL Comment implémenter des modèles de producteur et de consommateur de files d'attente dans PHP et MySQL Oct 15, 2023 pm 02:33 PM

Méthodes d'implémentation des modèles de producteur et de consommateur de files d'attente dans PHP et MySQL Avec le développement rapide des activités Internet, la nécessité de gérer un grand nombre de tâches dans le système est devenue de plus en plus urgente. Les files d'attente sont une solution courante pour gérer les tâches efficacement. L'implémentation du modèle producteur-consommateur de la file d'attente (Producer-ConsumerPattern) dans PHP et MySQL est une solution courante. Cet article présentera la méthode d'implémentation spécifique et fournira des exemples de code. modèle producteur-consommateur

Mécanisme de confirmation des messages de file d'attente et méthode de traitement des nouvelles tentatives de message en PHP et MySQL Mécanisme de confirmation des messages de file d'attente et méthode de traitement des nouvelles tentatives de message en PHP et MySQL Oct 15, 2023 pm 12:31 PM

Mécanisme de confirmation des messages de file d'attente et méthode de traitement des nouvelles tentatives de message dans PHP et MySQL Introduction : Avec le développement d'applications Internet, de nombreux services en ligne doivent traiter un grand nombre de requêtes, et ces requêtes nécessitent souvent une méthode de traitement asynchrone. Les files d'attente constituent une solution courante qui permet de dissocier efficacement les demandes du traitement, améliorant ainsi les performances et la fiabilité du système. Cet article présentera le mécanisme de confirmation des messages et la méthode de traitement des nouvelles tentatives de messages des files d'attente dans PHP et MySQL, et donnera des exemples de code spécifiques. 1. Le concept et la fonction de la file d'attente des messages

Mécanisme de tolérance aux pannes de file d'attente et méthode de mise en œuvre de la récupération des pannes dans PHP et MySQL Mécanisme de tolérance aux pannes de file d'attente et méthode de mise en œuvre de la récupération des pannes dans PHP et MySQL Oct 15, 2023 am 09:31 AM

Présentation du mécanisme de tolérance aux pannes et des méthodes de mise en œuvre de la récupération des pannes des files d'attente dans PHP et MySQL : La file d'attente est une structure de données couramment utilisée et largement utilisée en informatique. C'est similaire à la file d'attente réelle dans la mesure où les tâches peuvent être traitées selon le principe du premier entré, premier sorti. L'utilisation de files d'attente dans PHP et MySQL peut mettre en œuvre une planification de tâches complexe. Dans le même temps, des mécanismes de tolérance aux pannes et de récupération des pannes doivent être pris en compte pour garantir la fiabilité du système. Cet article présentera le mécanisme de tolérance aux pannes et les méthodes de récupération des pannes des files d'attente dans PHP et MySQL, et fournira des informations spécifiques.

See all articles