hadoop资源调度器
? ? ? ? ?hadoop支持多用户环境,在生产环境中,往往一个大的hadoop集群,供多个应用如Hive,Mahout等之类的使用。在多用户环境下,有的用户提交的工作量很大、很频繁,而有的很少,还有的优先级很高,那么如何保证“按需”来为各个用户分配资源(内存、CPU
? ? ? ? ?hadoop支持多用户环境,在生产环境中,往往一个大的hadoop集群,供多个应用如Hive,Mahout等之类的使用。在多用户环境下,有的用户提交的工作量很大、很频繁,而有的很少,还有的优先级很高,那么如何保证“按需”来为各个用户分配资源(内存、CPU、带宽、IO、磁盘)呢?这就需要用到资源调度器。
? ?? ? ?这里,我对hadoop的资源调度做个简单的归纳总结:
? ? ? ?? 一、基本术语
? ? ? ? 用户分组管理
? ? ? ? 用于按组为单位组织管理,某个用户只能向固定分组中提交作业,只能使用固定分组中配置的资源;同时可以限制每个用户提交的作业数,使用的资源量等
? ? ? ? 作业管理
? ? ? ? 包括作业提交权限控制,作业运行状态查看权限控制等。如:可限定可提交作业的用户;可限定可查看作业运行状态的用户;可限定普通用户只能修改自己作业的优先级,kill自己的作业;高级用户可以控制所有作业等。
? ? ? ? 用户(User)
? ? ? ? Hadoop使用Linux用户管理,Hadoop中的用户就是Linux中的用户
? ? ? ? 分组(group)
? ? ? ? Hadoop使用Linux分组管理,Hadoop中的分组就是Linux中的分组
? ? ? ? 池(pool)
? ? ? ? Hadoop Fair Scheduler中的概念,一个pool可以是一个user,一个group,或者一个queue。
? ? ? ? 队列(Queue)
? ? ? ? 队列是Hadoop提出的概念,一个Queue可以由任意几个Group和任意几个User组成。
?
?
? ? ? ? 二、资源调度管理简介
? ? ? ? Hadoop的资源管理核心:
? ? ? ? ? ? ? ?存储容量管理
? ? ? ? ? ? ? ? ? ? ?HDFS存储管理
? ? ? ? ? ? ? ?计算容量管理
? ? ? ? ? ? ? ? ? ? ?MR任务槽管理
? ? ? ? ? ? ? ? ? ? ?任务调度器
?
?
? ? ? ? ? 三、存储容量管理
?
? ? ? ? ? ? ? ?主要是对HDFS的管理:
? ? ? ? ? ? ? ? ? ? HDFS本身也是一种文件系统,与Linux文件系统有类似之处
? ? ? ? ? ? ? ? ? ? 对用户组、用户、路径设置Quotas(包括空间大小和文件数量)
? ? ? ? ? ? ? ? ? ? Hadoop dfsadmin -setSpaceQuota size path
? ? ? ? ? ? ? ? ? ? hadoop dfsadmin -setQuota number path
? ? ? ? ? ? ? ? ? ? Hadoop共享Linux的用户组和用户
? ? ? ? ? ? ? ? ? ? HDFS的权限控制:用户和用户组
?
?
?
? ? ? ? ? 四、计算容量管理
? ? ? ? ? ? ? ? ? 主要是对MapReduce任务槽的管理,任务槽也可以理解为服务器的资源综合统称:
? ? ? ? ? ? ? ? ? ? ? ? ?CPU(如何设置MR,见下面备注)
? ? ? ? ? ? ? ? ? ? ? ? ?内存(设置子任务的jvm参数和GC参数。在1 . 0以后的版本中,可以全局M/R内存和Job ? ? ? ? ? ? ? M/R内存)
? ? ? ? ? ? ? ? ? ? ? ? ?网络带宽
? ? ? ? ? ? ? ? ? ? ? ? ?磁盘IO
? ? ? ? ? ? ? ? ? ? ? ? ?单台主机或整个集群资源是有限的。在多任务、多用户环境下,大量并发提交和执行任务是非常常见的,这就导致资源不足而竞争,如何保证在有限资源或业务约束下有序调度和执行任务,需要有一个协调者,这就是Hadoop的资源调度器。
?
?
? ? ? ? ? ? ? ? ? Hadoop的调度器
? ? ? ? ? ? ? ? ? ? ? ? FIFO(default)。先进先出调度器?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Hadoop默认提供。
? ? ? ? ? ? ? ? ? ? ? ? Fair Scheduler(plugin)。公平调度器
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Facebook提供。
? ? ? ? ? ? ? ? ? ? ? ? Capacity Scheduler (plugin)。容量调度器
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Yahoo提供。
?
?
?
? ? ? ? ? ? ? ? 1、 FIFO Scheduler
? ? ? ? ? ? ? ? ? ?先进先出调度器
? ? ? ? ? ? ? ? ? ?优点:
? ? ? ? ? ? ? ? ? ? ? ? ? ?Hadoop默认提供。非常简单、JobTracker无负担
? ? ? ? ? ? ? ? ? ? ? ? ? ?支持五级优先级,每级一个队列,从队列优先级高低提取任务执行。五级分别是:Very Low 、Low 、Normal 、High 、Very Hign;
? ? ? ? ? ? ? ? ? ? ? ? ? ?在同级队列中,按提交Job的时间先后顺序执行
? ? ? ? ? ? ? ? ? ? ? ? ? ?无需额外配置
? ? ? ? ? ? ? ? ? ? 缺点:
? ? ? ? ? ? ? ? ? ? ? ? ? ?完全忽略不同作业的需求差异
? ? ? ? ? ? ? ? ? ??
?
?
? ? ? ? ? ? ? ? ? 2、Fair Scheduler?
? ? ? ? ? ? ? ? ? 公平分享调度器:在多个用户之间共享集群资源。它按资源池来组织作业,并把资源按时间公平地分到这些资源池里。在每一个资源池内,会使用公平共享地方法在运行作业之间共享容量。
?
? ? ? ? ? ? ? ? ? 特征:
? ? ? ? ? ? ? ? ? ? ? ? ? 支持多用户(默认一个用户对一个池,依赖于Linux多用户环境)
? ? ? ? ? ? ? ? ? ? ? ? ? 资源公平共享(公平共享量由优先级决定,同优先级按FIFO调度)
? ? ? ? ? ? ? ? ? ? ? ? ? 保证最小共享量
? ? ? ? ? ? ? ? ? ? ? ? ? 支持时间片抢占
? ? ? ? ? ? ? ? ? ? ? ? ? 限制作业并发量,以防止中间数据塞满磁盘
? ? ? ? ? ? ? ? ? ? ? ? ??
?
?
? ? ? ? ? ? ? ? ? ?3、Capacity Scheduler?
? ? ? ? ? ? ? ? ? ? ?容量调度器:使多个用户可以安全地共享一个大的集群,应用程序可以在容量限度下获取到需要的资源,最大化集群的吞吐率和利用率。它按队列来组织作业,每个队列会配置一定比例的计算资源,且所有提交到队列中的作业共享该队列中的资源。
? ? ? ? ? ? ? ? ? ??
? ? ? ? ? ? ? ? ? ? ?特征:
? ? ? ? ? ? ? ? ? ? ? ? ? ? 层次化的队列
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 层次化的队列支持在一个组织内子队列的优先共享资源,从而提供了更多的控制和预
测的能力,不支持抢占
? ? ? ? ? ? ? ? ? ? ? ? ? ? 资源容量保证
? ? ? ? ? ? ? ? ? ? ? ? ? ?队列实现了一种资源的划分,所有的应用都会被指定到特定的队列,这些应用所能使用到的资源受到队列所拥有资源的限制
? ? ? ? ? ? ? ? ? ? ? ? ? ? 安全性?
? ? ? ? ? ? ? ? ? ? ? ? ? ?每一个队列都有一个严格的ACL来控制那些用户可以访问队列,并且有一个safe-guard来保证用户不能够看或者修改其他用户的应用,而且每个队列或系统都可以设置管理员角色。?
? ? ? ? ? ? ? ? ? ? ? ? ? ? 弹性
? ? ? ? ? ? ? ? ? ? ? ? ??空闲的资源可以分配给任何队列,这样可能超出队列的资源限制。也就是说,如果集群有空闲的资源,而有些队列需要的资源超出了分给他的限制,这些空闲的资源将被分配给这些队列,这样就保证了资源的可预测性和弹性,从而防止了人工孤岛,帮助实现资源的优化利用。
? ? ? ? ? ? ? ? ? ? ? ? ? ? 多用户
? ? ? ? ? ? ? ? ? ? ? ? ? ?系列的综合设置可以防止单一的应用或用户占用队列或集群的全部资源,防止集群被单用户过度使用,从而保证了多用户可以共同使用集群
? ? ? ? ? ? ? ? ? ? ? ? ? ? 可操作性
? ? ? ? ? ? ? ? ? ? ? ? ? ?RuntimeConfiguration:一些设置可以在运行时进行配置,例如资源分配的容量, ? ? ? ? ? ? ? ? ? ? ACL
? ? ? ? ? ? ? ? ? ? ? ? ? ? 基于资源的调度?
? ? ? ? ? ? ? ? ? ? ? ? ? ? 支持资源密集型的应用,应用可以被指定分配超出缺省设置的更多的资源
?
?
? ? ? ? ? ? ?Fair VS Capacity
?
? ? ? ? ? ? ? 相同点
? ? ? ? ? ? ? ? ? ? 均支持多用户多队列,即:适用于多用户共享集群的应用环境
? ? ? ? ? ? ? ? ? ? 单个队列均支持优先级和FIFO调度方式
? ? ? ? ? ? ? ? ? ? 均支持资源共享,即某个queue中的资源有剩余时,可共享给其他缺资源的queue
? ? ? ? ? ? ? 异同点
? ? ? ? ? ? ? ? ? ? ?核心调度策略不同。 计算能力调度器的调度策略是,先选择资源利用率低的queue,然后在queue中同时考虑FIFO和memory constraint因素;而公平调度器仅考虑公平,而公平是通过作业缺额体现的,调度器每次选择缺额最大的job(queue的资源量,job优先级等仅用于计算作业缺额)。
? ? ? ? ? ? ? ? ? ? ?内存约束。计算能力调度器调度job时会考虑作业的内存限制,为了满足某些特殊job的特殊内存需求,可能会为该job分配多个slot;而公平调度器对这种特殊的job无能为力,只能杀掉这种task。
单一用户环境下,Fair只能共享一个池,Capacity可以多队列
?
已有 0 人发表留言,猛击->> 这里
ITeye推荐
- —软件人才免语言低担保 赴美带薪读研!—
原文地址:hadoop资源调度器, 感谢原作者分享。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Windows恢复环境(WinRE)是用于修复Windows操作系统错误的环境。进入WinRE后,您可以执行系统还原、出厂重置、卸载更新等操作。如果无法引导到WinRE,本文将指导您使用修复程序解决此问题。无法引导到Windows恢复环境如果无法引导至Windows恢复环境,请使用下面提供的修复程序:检查Windows恢复环境的状态使用其他方法进入Windows恢复环境您是否意外删除了Windows恢复分区?执行Windows的就地升级或全新安装下面,我们已经详细解释了所有这些修复。1]检查Wi

使用windowshello中,找不到支持的摄像头,常见的原因是使用的摄像头不支持人脸识别、摄像头驱动安装不正确导致的,那么接下来让我们一起去看一下怎么去设置。windowshello找不到支持的摄像头教程:原因一:摄像头驱动安装不对1、一般来说Win10系统可以自动为大部分摄像头安装驱动程序,如下,插上摄像头之后会有通知;2、这时我们打开设备管理器看看,摄像头驱动是否安装好,没有的话就需要手动操作一下。WIN+X,然后选择设备管理器;3、设备管理器窗口中,展开照相机选项,会显示摄像头的驱动型号

PyCharm社区版支持的插件足够吗?需要具体代码示例随着Python语言在软件开发领域的应用越来越广泛,PyCharm作为一款专业的Python集成开发环境(IDE),备受开发者青睐。PyCharm分为专业版和社区版两个版本,其中社区版是免费提供的,但其插件支持相对专业版有所限制。那么问题来了,PyCharm社区版支持的插件足够吗?本文将通过具体的代码示例

开源软件的利与弊:了解开源项目的优劣势,需要具体代码示例在当今数字化时代,开源软件越来越受到关注和推崇。作为一种基于合作和分享精神的软件开发模式,开源软件在不同领域都有着广泛的应用。然而,尽管开源软件具有诸多优势,但也存在一些挑战和限制。本文将深入探讨开源软件的利与弊,并通过具体的代码示例展示开源项目的优劣势。一、开源软件的优势1.1开放性和透明性开源软件

华硕tufz790plus支持内存频率华硕TUFZ790-PLUS主板是一款高性能主板,支持双通道DDR4内存,最大支持64GB内存。它的内存频率非常强大,最高可达4800MHz。具体支持的内存频率包括2133MHz、2400MHz、2666MHz、2800MHz、3000MHz、3200MHz、3600MHz、3733MHz、3866MHz、4000MHz、4133MHz、4266MHz、4400MHz、4533MHz、4600MHz、4733MHz和4800MHz。无论是日常使用还是高性能需

默认情况下,macOSSonoma会在您单击桌面壁纸时隐藏所有活动窗口。如果您倾向于在桌面上有一堆需要访问的文件,这将很方便。但是,如果您发现这种行为令人抓狂,则有一种方法可以将其关闭。Apple最新的macOSSonomaMac操作系统有一个新选项,称为“单击壁纸以显示桌面”。默认情况下启用,如果您倾向于打开多个窗口,并且想要访问桌面上的文件或文件夹,而不必最小化或移动窗口,则该选项可能特别有用。启用该功能并单击桌面墙纸后,所有打开的窗口都会暂时被扫到一边,从而直接访问桌面。完成后,您可以再次

115网盘里会有很多的资源,那么该怎么找资源呢?用户们可以在软件里搜索需要的资源,然后进入下载界面,然后选择存至网盘就可以了。这篇115网盘找资源方法介绍就能够告诉大家具体的内容,下面就是详细的介绍,赶紧来看看吧。115网盘怎么找资源答:在软件里搜索内容,然后点击存至网盘。具体介绍:1、首先在app里输入想要的资源。2、之后点击出现的关键词链接。3、接着进入下载界面。4、点击里面的存至网盘就可以了。

有一些用户使用xp系统,想要将他们的显卡升级为gtx960,但不确定gtx960是否支持xp系统。实际上,gtx960是支持xp系统的。我们只需在官网下载适用于xp系统的驱动程序,就可以使用gtx960了。下面让我们一起来看看具体的步骤吧。gtx960支持xp系统吗:GTX960可以与XP系统兼容。只需要下载并安装驱动程序,你就可以开始使用了。首先,我们需要打开NVIDIA官网并导航到主页。然后,我们需要在页面上方找到一个标签或按钮,它可能会被标记为“驱动程序”。一旦找到了这个选项,我们需要点击
