hadoop资源调度器
? ? ? ? ?hadoop支持多用户环境,在生产环境中,往往一个大的hadoop集群,供多个应用如Hive,Mahout等之类的使用。在多用户环境下,有的用户提交的工作量很大、很频繁,而有的很少,还有的优先级很高,那么如何保证“按需”来为各个用户分配资源(内存、CPU
? ? ? ? ?hadoop支持多用户环境,在生产环境中,往往一个大的hadoop集群,供多个应用如Hive,Mahout等之类的使用。在多用户环境下,有的用户提交的工作量很大、很频繁,而有的很少,还有的优先级很高,那么如何保证“按需”来为各个用户分配资源(内存、CPU、带宽、IO、磁盘)呢?这就需要用到资源调度器。
? ?? ? ?这里,我对hadoop的资源调度做个简单的归纳总结:
? ? ? ?? 一、基本术语
? ? ? ? 用户分组管理
? ? ? ? 用于按组为单位组织管理,某个用户只能向固定分组中提交作业,只能使用固定分组中配置的资源;同时可以限制每个用户提交的作业数,使用的资源量等
? ? ? ? 作业管理
? ? ? ? 包括作业提交权限控制,作业运行状态查看权限控制等。如:可限定可提交作业的用户;可限定可查看作业运行状态的用户;可限定普通用户只能修改自己作业的优先级,kill自己的作业;高级用户可以控制所有作业等。
? ? ? ? 用户(User)
? ? ? ? Hadoop使用Linux用户管理,Hadoop中的用户就是Linux中的用户
? ? ? ? 分组(group)
? ? ? ? Hadoop使用Linux分组管理,Hadoop中的分组就是Linux中的分组
? ? ? ? 池(pool)
? ? ? ? Hadoop Fair Scheduler中的概念,一个pool可以是一个user,一个group,或者一个queue。
? ? ? ? 队列(Queue)
? ? ? ? 队列是Hadoop提出的概念,一个Queue可以由任意几个Group和任意几个User组成。
?
?
? ? ? ? 二、资源调度管理简介
? ? ? ? Hadoop的资源管理核心:
? ? ? ? ? ? ? ?存储容量管理
? ? ? ? ? ? ? ? ? ? ?HDFS存储管理
? ? ? ? ? ? ? ?计算容量管理
? ? ? ? ? ? ? ? ? ? ?MR任务槽管理
? ? ? ? ? ? ? ? ? ? ?任务调度器
?
?
? ? ? ? ? 三、存储容量管理
?
? ? ? ? ? ? ? ?主要是对HDFS的管理:
? ? ? ? ? ? ? ? ? ? HDFS本身也是一种文件系统,与Linux文件系统有类似之处
? ? ? ? ? ? ? ? ? ? 对用户组、用户、路径设置Quotas(包括空间大小和文件数量)
? ? ? ? ? ? ? ? ? ? Hadoop dfsadmin -setSpaceQuota size path
? ? ? ? ? ? ? ? ? ? hadoop dfsadmin -setQuota number path
? ? ? ? ? ? ? ? ? ? Hadoop共享Linux的用户组和用户
? ? ? ? ? ? ? ? ? ? HDFS的权限控制:用户和用户组
?
?
?
? ? ? ? ? 四、计算容量管理
? ? ? ? ? ? ? ? ? 主要是对MapReduce任务槽的管理,任务槽也可以理解为服务器的资源综合统称:
? ? ? ? ? ? ? ? ? ? ? ? ?CPU(如何设置MR,见下面备注)
? ? ? ? ? ? ? ? ? ? ? ? ?内存(设置子任务的jvm参数和GC参数。在1 . 0以后的版本中,可以全局M/R内存和Job ? ? ? ? ? ? ? M/R内存)
? ? ? ? ? ? ? ? ? ? ? ? ?网络带宽
? ? ? ? ? ? ? ? ? ? ? ? ?磁盘IO
? ? ? ? ? ? ? ? ? ? ? ? ?单台主机或整个集群资源是有限的。在多任务、多用户环境下,大量并发提交和执行任务是非常常见的,这就导致资源不足而竞争,如何保证在有限资源或业务约束下有序调度和执行任务,需要有一个协调者,这就是Hadoop的资源调度器。
?
?
? ? ? ? ? ? ? ? ? Hadoop的调度器
? ? ? ? ? ? ? ? ? ? ? ? FIFO(default)。先进先出调度器?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Hadoop默认提供。
? ? ? ? ? ? ? ? ? ? ? ? Fair Scheduler(plugin)。公平调度器
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Facebook提供。
? ? ? ? ? ? ? ? ? ? ? ? Capacity Scheduler (plugin)。容量调度器
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Yahoo提供。
?
?
?
? ? ? ? ? ? ? ? 1、 FIFO Scheduler
? ? ? ? ? ? ? ? ? ?先进先出调度器
? ? ? ? ? ? ? ? ? ?优点:
? ? ? ? ? ? ? ? ? ? ? ? ? ?Hadoop默认提供。非常简单、JobTracker无负担
? ? ? ? ? ? ? ? ? ? ? ? ? ?支持五级优先级,每级一个队列,从队列优先级高低提取任务执行。五级分别是:Very Low 、Low 、Normal 、High 、Very Hign;
? ? ? ? ? ? ? ? ? ? ? ? ? ?在同级队列中,按提交Job的时间先后顺序执行
? ? ? ? ? ? ? ? ? ? ? ? ? ?无需额外配置
? ? ? ? ? ? ? ? ? ? 缺点:
? ? ? ? ? ? ? ? ? ? ? ? ? ?完全忽略不同作业的需求差异
? ? ? ? ? ? ? ? ? ??
?
?
? ? ? ? ? ? ? ? ? 2、Fair Scheduler?
? ? ? ? ? ? ? ? ? 公平分享调度器:在多个用户之间共享集群资源。它按资源池来组织作业,并把资源按时间公平地分到这些资源池里。在每一个资源池内,会使用公平共享地方法在运行作业之间共享容量。
?
? ? ? ? ? ? ? ? ? 特征:
? ? ? ? ? ? ? ? ? ? ? ? ? 支持多用户(默认一个用户对一个池,依赖于Linux多用户环境)
? ? ? ? ? ? ? ? ? ? ? ? ? 资源公平共享(公平共享量由优先级决定,同优先级按FIFO调度)
? ? ? ? ? ? ? ? ? ? ? ? ? 保证最小共享量
? ? ? ? ? ? ? ? ? ? ? ? ? 支持时间片抢占
? ? ? ? ? ? ? ? ? ? ? ? ? 限制作业并发量,以防止中间数据塞满磁盘
? ? ? ? ? ? ? ? ? ? ? ? ??
?
?
? ? ? ? ? ? ? ? ? ?3、Capacity Scheduler?
? ? ? ? ? ? ? ? ? ? ?容量调度器:使多个用户可以安全地共享一个大的集群,应用程序可以在容量限度下获取到需要的资源,最大化集群的吞吐率和利用率。它按队列来组织作业,每个队列会配置一定比例的计算资源,且所有提交到队列中的作业共享该队列中的资源。
? ? ? ? ? ? ? ? ? ??
? ? ? ? ? ? ? ? ? ? ?特征:
? ? ? ? ? ? ? ? ? ? ? ? ? ? 层次化的队列
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 层次化的队列支持在一个组织内子队列的优先共享资源,从而提供了更多的控制和预
测的能力,不支持抢占
? ? ? ? ? ? ? ? ? ? ? ? ? ? 资源容量保证
? ? ? ? ? ? ? ? ? ? ? ? ? ?队列实现了一种资源的划分,所有的应用都会被指定到特定的队列,这些应用所能使用到的资源受到队列所拥有资源的限制
? ? ? ? ? ? ? ? ? ? ? ? ? ? 安全性?
? ? ? ? ? ? ? ? ? ? ? ? ? ?每一个队列都有一个严格的ACL来控制那些用户可以访问队列,并且有一个safe-guard来保证用户不能够看或者修改其他用户的应用,而且每个队列或系统都可以设置管理员角色。?
? ? ? ? ? ? ? ? ? ? ? ? ? ? 弹性
? ? ? ? ? ? ? ? ? ? ? ? ??空闲的资源可以分配给任何队列,这样可能超出队列的资源限制。也就是说,如果集群有空闲的资源,而有些队列需要的资源超出了分给他的限制,这些空闲的资源将被分配给这些队列,这样就保证了资源的可预测性和弹性,从而防止了人工孤岛,帮助实现资源的优化利用。
? ? ? ? ? ? ? ? ? ? ? ? ? ? 多用户
? ? ? ? ? ? ? ? ? ? ? ? ? ?系列的综合设置可以防止单一的应用或用户占用队列或集群的全部资源,防止集群被单用户过度使用,从而保证了多用户可以共同使用集群
? ? ? ? ? ? ? ? ? ? ? ? ? ? 可操作性
? ? ? ? ? ? ? ? ? ? ? ? ? ?RuntimeConfiguration:一些设置可以在运行时进行配置,例如资源分配的容量, ? ? ? ? ? ? ? ? ? ? ACL
? ? ? ? ? ? ? ? ? ? ? ? ? ? 基于资源的调度?
? ? ? ? ? ? ? ? ? ? ? ? ? ? 支持资源密集型的应用,应用可以被指定分配超出缺省设置的更多的资源
?
?
? ? ? ? ? ? ?Fair VS Capacity
?
? ? ? ? ? ? ? 相同点
? ? ? ? ? ? ? ? ? ? 均支持多用户多队列,即:适用于多用户共享集群的应用环境
? ? ? ? ? ? ? ? ? ? 单个队列均支持优先级和FIFO调度方式
? ? ? ? ? ? ? ? ? ? 均支持资源共享,即某个queue中的资源有剩余时,可共享给其他缺资源的queue
? ? ? ? ? ? ? 异同点
? ? ? ? ? ? ? ? ? ? ?核心调度策略不同。 计算能力调度器的调度策略是,先选择资源利用率低的queue,然后在queue中同时考虑FIFO和memory constraint因素;而公平调度器仅考虑公平,而公平是通过作业缺额体现的,调度器每次选择缺额最大的job(queue的资源量,job优先级等仅用于计算作业缺额)。
? ? ? ? ? ? ? ? ? ? ?内存约束。计算能力调度器调度job时会考虑作业的内存限制,为了满足某些特殊job的特殊内存需求,可能会为该job分配多个slot;而公平调度器对这种特殊的job无能为力,只能杀掉这种task。
单一用户环境下,Fair只能共享一个池,Capacity可以多队列
?
已有 0 人发表留言,猛击->> 这里
ITeye推荐
- —软件人才免语言低担保 赴美带薪读研!—
原文地址:hadoop资源调度器, 感谢原作者分享。

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Windows復原環境(WinRE)是用來修復Windows作業系統錯誤的環境。進入WinRE後,您可以執行系統還原、出廠重設、卸載更新等操作。如果無法引導到WinRE,本文將指導您使用修復程式解決此問題。無法引導至Windows復原環境如果無法引導至Windows復原環境,請使用下方提供的修復程式:檢查Windows復原環境的狀態使用其他方法進入Windows復原環境您是否意外刪除了Windows復原分割區?執行Windows的就地升級或全新安裝下面,我們已經詳細解釋了所有這些修復。 1]檢查Wi

在使用windowshello中,找不到支援的鏡頭,常見的原因是使用的攝影機不支援人臉辨識、攝影機驅動安裝不正確導致的,那麼接下來讓我們一起去看一下怎麼去設定。 windowshello找不到支援的攝影機教學:原因一:攝影機驅動安裝不對1、一般來說Win10系統可以自動為大部分攝影機安裝驅動程序,如下,插上攝影機之後會有通知;2、這時我們打開設備管理器看看,攝影機驅動是否安裝好,沒有的話就需要手動操作一下。 WIN+X,然後選擇裝置管理員;3、裝置管理員視窗中,展開照相機選項,會顯示相機的驅動型號

115網盤裡會有很多的資源,那該怎麼找資源呢?使用者可以在軟體裡搜尋所需的資源,然後進入下載介面,然後選擇儲存到網盤就可以了。這篇115網盤找資源方法介紹就能夠告訴大家具體的內容,以下就是詳細的介紹,趕緊來看看吧。 115網盤怎麼找資源答:在軟體裡搜尋內容,然後點選儲存至網盤。具體介紹:1、先在app裡輸入想要的資源。 2、之後點選出現的關鍵字連結。 3、接著進入下載介面。 4.點擊裡面的存到網盤就可以了。

華碩tufz790plus支援內存頻率華碩TUFZ790-PLUS主機板是一款高性能主機板,支援雙通道DDR4內存,最大支援64GB內存。它的記憶體頻率非常強大,最高可達4800MHz。特定支援的記憶體頻率包括2133MHz、2400MHz、2666MHz、2800MHz、3000MHz、3200MHz、3600MHz、3733MHz、3866MHz、4000MHz、4133MHz、4266MHz、MHz、MHz、MHz、MHz、MHz、MHz、MHz Hz。無論是日常使用還是高效能需

開源軟體的利與弊:了解開源專案的優劣勢,需要具體程式碼範例在當今數位化時代,開源軟體越來越受到關注和推崇。作為一種基於合作和分享精神的軟體開發模式,開源軟體在不同領域都有廣泛的應用。然而,儘管開源軟體具有諸多優勢,但也存在一些挑戰和限制。本文將深入探討開源軟體的利與弊,並透過具體的程式碼範例展示開源專案的優劣勢。一、開源軟體的優勢1.1開放性與透明性開源軟體

PyCharm社群版支援的插件足夠嗎?需要具體程式碼範例隨著Python語言在軟體開發領域的應用越來越廣泛,PyCharm作為一款專業的Python整合開發環境(IDE),備受開發者青睞。 PyCharm分為專業版和社群版兩個版本,其中社群版是免費提供的,但其外掛程式支援相對專業版有所限制。那麼問題來了,PyCharm社群版支援的插件夠嗎?本文將透過具體的程式碼範例

預設情況下,macOSSonoma會在您按一下桌面桌布時隱藏所有活動視窗。如果您傾向於在桌面上有一堆需要存取的文件,這將很方便。但是,如果您發現這種行為令人抓狂,則有一種方法可以將其關閉。 Apple最新的macOSSonomaMac作業系統有一個新選項,稱為「點擊壁紙以顯示桌面」。預設情況下啟用,如果您傾向於打開多個窗口,並且想要訪問桌面上的文件或資料夾,而不必最小化或移動窗口,則該選項可能特別有用。啟用該功能並點擊桌面牆紙後,所有開啟的視窗都會暫時被掃到一邊,從而直接存取桌面。完成後,您可以再次

有一些用戶使用xp系統,想要將他們的顯示卡升級為gtx960,但不確定gtx960是否支援xp系統。實際上,gtx960是支援xp系統的。我們只需在官網下載適用於xp系統的驅動程序,就可以使用gtx960了。下面就讓我們一起來看看具體的步驟。 gtx960支援xp系統嗎:GTX960可以與XP系統相容。只需要下載並安裝驅動程序,你就可以開始使用了。首先,我們需要開啟NVIDIA官網並導航到主頁。然後,我們需要在頁面上方找到一個標籤或按鈕,它可能會被標記為「驅動程式」。一旦找到了這個選項,我們就需要點擊
