Hadoop Rumen介绍
作者: Dong | 新浪微博: 西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明 网址:http://dongxicheng.org/mapreduce/hadoop-rumen-introduction/ 什么是Hadoop Rumen? Hadoop Rumen是为Hadoop MapReduce设计的日志解析和分析工具
作者:Dong | 新浪微博:西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址:http://dongxicheng.org/mapreduce/hadoop-rumen-introduction/
什么是Hadoop Rumen?
Hadoop Rumen是为Hadoop MapReduce设计的日志解析和分析工具,它能够将JobHistory 日志解析成有意义的数据并格式化存储。Rumen可以单独使用,但通常作为其他组件,比如GridMix (v3) 和 Mumak的基础库。
Hadoop Rumen设计动机
对于任何一个工作在Hadoop之上的外部工具,分析JobHistory日志都是必须的工作之一。基于这点考虑,Hadoop应内嵌一个JobHistory日志分析工具。
统计分析MapReduce作业的各种属性,比如任务运行时间、任务失败率等,通常是基准测试或者模拟器必备的功能,Hadoop Rumen可以为任务生成Cumulative Distribution Functions (CDF),这可以用于推断不完整的、失败的或者丢失的任务。
Hadoop Rumen基本构成
Hadoop Rumen已经内置在Apache Hadoop 1.0之上(包括0.21.x,0.22.x,CDH3)各个版本中,位于org.apache.hadoop.tools.rumen包中,通常被Hadoop打包成独立的jar包hadoop-tools-[VERSION].jar。Hadoop Rumen由两部分组成:
(1) Trace Builder
将JobHistory日志解析成易读的格式,当前仅支持json格式。Trace Builder的输出被称为job trace(作业运行踪迹),我们通过job trace很容易模拟(还原)作业的整个运行过程。
(2) ?Folder
将job trace按时间进行压缩或者扩张。这个还是为了方便其他组件,比如GridMix (v3) 和 Mumak,使用。Folder可以将作业运行过程进行等比例缩放,以便在更短的时间内模拟作业运行过程。
试用Hadoop Rumen
你可以通过两种方式运行Rumen,一种是使用集成化(综合所有功能)的HadoopLogsAnalyzer类,在很多Hadoop版本中,这个类已经过期,不推荐使用,另一种是使用TraceBuilder和Folder类。它们的运行方式基本类似,下面以HadoopLogsAnalyzer类为例进行说明:
bin/hadoop org.apache.hadoop.tools.rumen.HadoopLogsAnalyzer -v1 -write-job-trace file:///tmp/job-trace.json -write-topology file:///tmp/topology.json file:///software/hadoop/logs/history/done/
其中,“-v1”表示采用version 1的JobHsitory格式,如果你的Hadoop版本是0.20.x系列,则需要加这个参数,“-write-job-trace”是输出的job trace存放位置,“-write-topology”是拓扑结构存放位置,Rumen能够通过分析JobHistory中所有文件得到Hadoop集群的拓扑结构。最后一项紧跟你的JobHistory 中done目录存放位置,一般在${HDOOP_LOG}/history/done中,如果在本地磁盘,则需在目录前加前缀file://,如果在HDFS上需在目录前加前缀“hdfs://”。
下面是截取的job-trace.json和topology.json文件内容:
【job-trace.json】
“priority” : “NORMAL”, “jobID” : “job_201301061549_0003″, “mapTasks” : [ { "attempts" : [ { "location" : null, "hostName" : "HADOOP001", "startTime" : 1357460454343, "finishTime" : 1357460665299, "result" : "KILLED", "shuffleFinished" : -1, "sortFinished" : -1, "attemptID" : "attempt_201301061549_0003_m_000000_0", "hdfsBytesRead" : -1, "hdfsBytesWritten" : -1, "fileBytesRead" : -1, "fileBytesWritten" : -1, "mapInputRecords" : -1, "mapOutputBytes" : -1, "mapOutputRecords" : -1, "combineInputRecords" : -1, "reduceInputGroups" : -1, "reduceInputRecords" : -1, "reduceShuffleBytes" : -1, "reduceOutputRecords" : -1, "spilledRecords" : -1, "mapInputBytes" : -1 } ], “preferredLocations” : [ ], “startTime” : 1357460454686, “finishTime” : -1, “inputBytes” : -1, “inputRecords” : -1, “outputBytes” : -1, “outputRecords” : -1, “taskID” : “task_201301061549_0003_m_000000″, “numberMaps” : -1, “numberReduces” : -1, “taskStatus” : null, “taskType” : “MAP” }, { ….
【topology.json】
{ “name” : “<root>”, “children” : [ { "name" : "default-rack", "children" : [ { "name" : " HADOOP001", "children" : null }, { "name" : " HADOOP002", "children" : null }, { "name" : HADOOP003", "children" : null }, { "name" : " HADOOP004", "children" : null }, { "name" : " HADOOP005", "children" : null }, { "name" : " HADOOP006", "children" : null } ] } ] }</root>
原创文章,转载请注明: 转载自董的博客
本文链接地址: http://dongxicheng.org/mapreduce/hadoop-rumen-introduction/
作者:Dong,作者介绍:http://dongxicheng.org/about/
Copyright © 2012
This feed is for personal, non-commercial use only.
The use of this feed on other websites breaches copyright. If this content is not in your news reader, it makes the page you are viewing an infringement of the copyright. (Digital Fingerprint:
)

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











1. まずモバイル Web ブラウザを開き、Weibo Web バージョンを検索し、入力後に左上隅にあるアバター ボタンをクリックします。 2. 次に、右上隅の「設定」をクリックします。 3. 設定でバージョン切り替えオプションをクリックします。 4. 次に、バージョン スイッチでカラー バージョン オプションを選択します。 5. 「検索」をクリックして検索ページに入ります。 6. キーワードを入力した後、「Find People」をクリックします。 7. 検索完了インターフェイスが表示されたら、「フィルター」をクリックします。 8. 最後に、リリース時刻列に特定の日付を入力し、[フィルター] をクリックします。

1. Weibo アプリの右下隅にある [My] をクリックして、個人のホームページに入ります。 2. 次に、右上隅にある歯車アイコンをクリックします。 3. この時点で、設定ページに入ります。ここで[ブロック設定]を選択して入ります。 4. ブロック設定では、ブロックした友達を確認してタップし、ポップアップ オプションで [ブロックを解除] をクリックします。 5. または、ユーザーは Weibo ユーザーを直接検索してブロックされたユーザーのホームページに入り、右上の [...] をクリックしてブラックリストを削除することもできます。

1. Weibo を開き、「マイ」をクリックして、右上隅にある「設定」オプションをクリックします。 2.設定を開いた後、その中にあるプッシュ通知設定を見つけてクリックします。 3. プッシュ通知設定を入力した後、[特別な関心] を見つけて、[リアルタイム通知] をクリックします。

1. まず Weibo を開き、「検索」をクリックし、「その他のホット検索」をクリックします。 2. 次に、ホット検索を選択して入力します。 3. 次に、ホット検索コメントライブモードに入り、右上隅にある標準バージョンを見つけてクリックします。 4. 最後に、ホット検索の標準コメント エリアに戻ります。引き続きライブ コメント エリアを表示したい場合は、右上隅のライブ バージョンをクリックします。注: リアルタイム コメントが多い場合にのみ、自動的にライブ モードに入ります。一部のホット検索では、自動的にライブ モードに入ります。通常、ホット検索は標準モードで行われます。

1. まず携帯電話で Weibo を開き、右下隅の [Me] をクリックします (図を参照)。 2. 次に、右上隅の [歯車] をクリックして設定を開きます (図を参照)。 3. 次に、[一般設定] を見つけて開きます (図を参照)。 4. 次に、[Video Follow] オプションを入力します (図を参照)。 5. 次に、[ビデオアップロード解像度]設定を開きます(図を参照)。 6. 最後に、圧縮を避けるために [オリジナルの画質] を選択します (図を参照)。

1. まず Weibo を開き、「My」をクリックして、下書きボックスをクリックします。 2. 次に、いずれかのドラフトを長押しし、クリックしてドラフト ボックスをクリアするか、ドラフトを削除します。 3. 最後に「OK」をクリックします。

1. まず、Weibo を開き、「マイ」をクリックし、アバターをクリックして、個人のホームページに入ります。 2. 次に、背景画像をクリックします。 3. 次に、 をクリックしてビデオのカバーを変更します。 4. 最後に、アルバム内のビデオを選択し、「次へ」をクリックして、公開してアップロードします。

Weibo ユーザーが SVIP 機能を有効にすると、訪問者記録を管理でき、知らない人のホームページを訪問した場合、表示する前に削除することができるため、ホームページを閲覧していることを相手に知られることはありません。 Weibo svip で訪問者記録を削除した後、相手はそれを見ることができますか? Weibo svip で訪問者記録を削除した後、相手はそれを見ることができません。訪問者数は表示されますが、訪問者、ユーザーの ID とアバターは表示されません。 2. 一般ユーザーおよびVIPユーザーは、アクセス履歴の削除や閲覧はできず、閲覧者数の確認のみが可能です。 3. Weiboのアクセスデータは毎日8時に更新されますので、アクセス記録を削除したい場合は、
