解决HDFS磁盘扫描导致死亡结点的问题-mysql教程-PHP中文網

现象总结

攻坚

总结

解决

首頁

資料庫

mysql教程

解决HDFS磁盘扫描导致死亡结点的问题

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:32 PM

hdfs 導致掃描磁碟結點解決問題

在Hadoop集群从1.0升级到2.0之后，我们一直在解决很多很多的问题。在今年8月初，我们检测到线上频繁有机器变成死亡结点，一段时间后自动恢复。进入死亡结点状态的DataNode将不能读写数据块。我们观察了一下日志，看到DataNode中打印出很多接受数据快传输的线

在Hadoop集群从1.0升级到2.0之后，我们一直在解决很多很多的问题。在今年8月初，我们检测到线上频繁有机器变成死亡结点，一段时间后自动恢复。进入死亡结点状态的DataNode将不能读写数据块。我们观察了一下日志，看到DataNode中打印出很多接受数据快传输的线程(DataXceiver)，线程都是在Receiving的状态，而没有结束。估摸了一下在死亡结点发生的阶段大约有300个左右的线程积累下来。但是，没找到其它突破口。

由于，HDFS的Client会自动重试。如果一个结点进入死亡结点，只要另外的数据块的结点依然可读，Client还是可以读取到数据块的。所以，死亡结点的问题对线上业务没有造成影响。当时，还有其它优先级更高的事情，所以，问题转为观察状态。

然后终于在一次机房意外断电，集群重启之后，一个线上的作业报找不到数据块。经日志确认，产生的原因是拥有这个数据块副本的两个机器同时进入死亡结点！于是，问题转入高优先级，优先解决。

现象总结

出现死亡结点的机器集中在磁盘数量较多的机器。
死亡结点跟机器的CPU，内存或者网络关系不大。
出现死亡结点的时候，DataNode有大量DataXceiver的线程积压。
虽然，总体上机器出现死亡结点的时间比较分散。但是，单一的DataNode上出现死亡结点的间隔必然是6小时或者6小时的整数倍。

攻坚

首先知道，DataNode进入死亡结点状态是因为NameNode长期接收不到DataNode的心跳包，就会把DataNode归入死亡结点。而DataNode的心跳线程是单独一个线程。

现象的最后一点，6小时的间隔，可谓是这个问题的突破点。在配置文件中找到6小时的间隔的工作有两种：

DataNode和NameNode的6小时一次的心跳报告。用于更新NameNode上的Block信息。
DataNode每6小时一次的磁盘扫描。用于更新内存中的信息和磁盘中信息的不一致。

根据两者打印的日志和死亡结点发生的时间进行精确对比，发现后者的时间基本吻合。然后，我们在集中查看磁盘扫描(DirectoryScanner)的代码。

描述一下磁盘扫描的工作流程：

启动一个主线程和一个线程池。
主线程往线程池提交多个磁盘扫描的任务。任务是遍历整个数据目录记录所有的数据块的信息和对应的Meta信息
主线程等待线程池的任务返回，收集扫描结果。
将扫描结果和内存中的数据块进行对比，得到DiffRecord，算法复杂度O(n)，数据块越多速度越慢。
根据DiffRecord修改对应的内存数据。

第一步，主线程和线程池的线程都是Daemon线程。Daemon线程的默认优先级比较低。

第二步，由于涉及到磁盘读写。如果，外部磁盘压力大的时候，会拖慢整个进度。但是，整个过程没有加锁。不可能对其它线程产生影响。

第四步，数据块对比过程，为了阻止对blockMap的修改，整个过程针对DataSet对象加锁(DataSet对象是DataNode中保存所有数据块信息的内存对象)。

那心跳进程为什么会使用DataSet的对象锁? 我们写了个小程序测试，在对DataSet加锁的情况下，启动心跳线程。发现心跳线程在获取磁盘的可用空间的时候，需要获得DataSet的锁。

于是，问题变得清晰了：在6小时一次的磁盘扫描中，由于DirectoryScanner长久占用了DataSet的锁，导致心跳线程不能发出心跳包。DataNode进入死亡结点状态。而问题频发在磁盘较多的机器是因为，数据块数量和对比的过程的耗时相关。那是什么原因导致DirectoryScanner长久占用了DataSet的锁呢?

我们观察了加锁部分的代码，没有找到磁盘操作。我们估摸了下，最多数据块的机器也才80W左右各数据块。如果是纯内存操作，不可能占用锁长达10分钟甚至30分钟之久。

然后我们将怀疑的地方锁定在主线程的Daemon属性。因为，Daemon属性的线程优先级较低，怀疑是主线程在多线程的情况下，分配不到CPU时间片。

于是，我们作出第一个修改：将主线程改为普通线程的优先级。

上线第二天，死亡结点现象还是出现，现象出现的时间相对来说是短了点，但还是不能解决问题。

于是，我们开了个大招：针对死亡结点频发的结点，加上一个每分钟打印一次DataNode的jstack的脚本。

终于我们捕获了在死亡结点发生时候的几个堆栈。经过对比分析，得出的结论是：

(呵呵)数据块对比过程中，有一个使用Java的File对象的获取文件长度的getlength方法。而这个方法是直接调用一个native方法，获取磁盘上文件的长度。

当初我们就猜想，加锁部分是否有磁盘的IO操作。因为IO操作的快慢，会受到当时的机器状态影响很大。不得不说，这个位置太隐蔽了。看了很久都没发现，还好有jstack截获出来。

总结

6小时一次的DirectoryScanner在数据块对比过程中，会对DataSet加锁。如果，机器的磁盘压力很高的情况下，对比过程中的磁盘操作十分耗时。导致DirectoryScanner长期持有DataSet的锁，阻塞心跳线程和所有的DataXceiver的线程。DataNode变成死亡结点。一段时间后，对比过程结束。DataSet锁释放，DataNode回归正常工作。

解决

知道问题了就好解决了。我们采取的方式是把getlength操作提取到第二步的线程池的异步磁盘扫描中进行。

部署到线上后，数据对比时间降低到2秒左右。至此，死亡结点问题解决!

后续我们把Patch提交到Hadoop社区HDFS-5341,其中蹩脚的英语语法请大家无视。

原文地址：解决HDFS磁盘扫描导致死亡结点的问题, 感谢原作者分享。

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1664

CakePHP 教程

1423

Laravel 教程

1317

PHP教程

1268

C# 教程

1246

Related knowledge

Win11系統無法安裝中文語言套件的解決方法 Mar 09, 2024 am 09:48 AM

Win11系統無法安裝中文語言包的解決方法隨著Windows11系統的推出，許多用戶開始升級他們的作業系統以體驗新的功能和介面。然而，一些用戶在升級後發現他們無法安裝中文語言包，這給他們的使用體驗帶來了困擾。在本文中，我們將探討Win11系統無法安裝中文語言套件的原因，並提供一些解決方法，幫助使用者解決這個問題。原因分析首先，讓我們來分析一下Win11系統無法

五招教你解決黑鯊手機開不了機的問題！ Mar 24, 2024 pm 12:27 PM

隨著智慧型手機技術的不斷發展，手機在我們日常生活中扮演著越來越重要的角色。而作為一款專注於遊戲效能的旗艦手機，黑鯊手機備受玩家青睞。然而，有時候我們也會面臨到黑鯊手機開不了機的情況，這時候我們就需要採取一些措施來解決這個問題。接下來，就讓我們來分享五招教你解決黑鯊手機開不了機的問題：第一招：檢查電池電量首先，確保你的黑鯊手機有足夠的電量。可能是因為手機電量耗盡

小紅書發布自動儲存圖片怎麼解決？發布自動保存圖片在哪裡？ Mar 22, 2024 am 08:06 AM

隨著社群媒體的不斷發展，小紅書已經成為越來越多年輕人分享生活、發現美好事物的平台。許多用戶在發布圖片時遇到了自動儲存的問題，這讓他們感到十分困擾。那麼，如何解決這個問題呢？一、小紅書發布自動儲存圖片怎麼解決？ 1.清除快取首先，我們可以嘗試清除小紅書的快取資料。步驟如下：（1）開啟小紅書，點選右下角的「我的」按鈕；（2）在個人中心頁面，找到「設定」並點選；（3）向下捲動，找到「清除快取」選項，點擊確認。清除快取後，重新進入小紅書，嘗試發布圖片看是否解決了自動儲存的問題。 2.更新小紅書版本確保你的小

無法在此裝置上載入驅動程式怎麼解決？ (親測有效) Mar 14, 2024 pm 09:00 PM

　　大家都知道，如果電腦無法載入驅動程序，該設備可能就無法正常工作或與電腦進行正確的互動。那在電腦上彈出無法在此裝置上載入驅動程式的提示框，我們要如何解決呢？下面小編就教大家兩招輕鬆解決問題。　　無法在此裝置上載入驅動程式解決方法　　1、開始功能表搜尋「核心隔離」。　　2、將記憶體完整性關閉，上方提示「記憶體完整性已關閉。你的裝置可能易受攻擊。」點擊後方忽略即可，不會對使用有影響。　　3.重啟機器之後即可解決問題。

將VirtualBox固定磁碟轉換為動態磁碟，反之亦然 Mar 25, 2024 am 09:36 AM

在建立虛擬機器時，系統會要求您選擇磁碟類型，您可以選擇固定磁碟或動態磁碟。如果您選擇了固定磁碟，後來意識到需要動態磁碟，或者相反，該怎麼辦?好!你可以把一種轉換成另一種。在這篇文章中，我們將看到如何將VirtualBox固定磁碟轉換為動態磁碟，反之亦然。動態磁碟是一種虛擬硬碟，它最初具有較小的大小，隨著您在虛擬機器中儲存數據，其大小會相應增長。動態磁碟在節省儲存空間方面非常高效，因為它們只佔用所需的主機儲存空間。然而，隨著磁碟容量的擴展，可能會稍微影響電腦的效能。固定磁碟和動態磁碟是虛擬機器中常用的

華為瀏覽器已停止造訪該網頁怎麼解決 Feb 26, 2024 pm 01:28 PM

華為瀏覽器已停止造訪該網頁怎麼解決？使用華為手機瀏覽器造訪某些網站時，可能會出現禁止造訪的提示，使用戶無法正常瀏覽相關內容。這對用戶而言非常不便。那麼，當我們遇到華為手機瀏覽器網站禁止造訪的情況時，該怎麼辦呢？以下小編將為您提供華為瀏覽器網站禁止存取解決方法，希望對您有所幫助。華為瀏覽器網站禁止訪問解決方法1、打開華為手機瀏覽器後，點擊下方的三點圖標，然後點擊設定。 2.進入設定後，點選【安全與隱私】3、將【安全瀏覽】右側的開關關閉，即可解除網站存取限制。以上便是華為瀏覽器網站禁止存取解決方法的

解讀Oracle錯誤3114：原因及解決方法 Mar 08, 2024 pm 03:42 PM

標題：分析Oracle錯誤3114：原因及解決方法在使用Oracle資料庫時，常常會遇到各種錯誤代碼，其中錯誤3114是比較常見的一個。此錯誤一般涉及資料庫連結的問題，可能導致存取資料庫時出現異常狀況。本文將對Oracle錯誤3114進行解讀，探討其造成的原因，並給出解決該錯誤的具體方法以及相關的程式碼範例。 1.錯誤3114的定義Oracle錯誤3114通

WordPress安裝問題解決指南，一文搞定 Feb 29, 2024 am 11:06 AM

WordPress是一款非常受歡迎的開源內容管理系統，許多個人用戶和企業選擇使用WordPress來建立和管理自己的網站。然而，在安裝WordPress的過程中，有時會遇到一些問題，例如資料庫連線錯誤、檔案權限問題等。本文將針對常見的WordPress安裝問題進行解決指南，透過具體的程式碼範例幫助使用者快速解決問題。問題一：資料庫連線錯誤當在安裝WordPress

See all articles

解决HDFS磁盘扫描导致死亡结点的问题

现象总结

攻坚

总结

解决

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題