社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 資料庫 > mysql教程 > hadoop mapreduce数据排序

hadoop mapreduce数据排序

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

發布： 2016-06-07 14:58:43

原創

1481 人瀏覽過

hadoop mapreduce数据排序有如下3个输入文件： file0 [plain] 2 32 654 32 15 756 65223 file1 [plain] 5956 22 650 92 file2 [plain] 26 54 6 由于reduce获得的key是按字典顺序排序的，利用默认的规则即可。 [java] // map将输入中的value化成IntWritable

hadoop mapreduce数据排序

有如下3个输入文件：

file0

[plain]

2

32

654

32

15

756

65223

file1

[plain]

5956

22

650

92

file2

[plain]

26

54

6

由于reduce获得的key是按字典顺序排序的，利用默认的规则即可。

[java]

// map将输入中的value化成IntWritable类型，作为输出的key

public static class Map extends

Mapper

private static IntWritable data = new IntWritable();

// 实现map函数

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

String line = value.toString();

data.set(Integer.parseInt(line));

context.write(data, new IntWritable(1));

}

}

// reduce将输入中的key复制到输出数据的key上，

// 然后根据输入的value-list中元素的个数决定key的输出次数

// 用全局linenum来代表key的位次

public static class Reduce extends

Reducer {

private static IntWritable linenum = new IntWritable(1);

// 实现reduce函数

public void reduce(IntWritable key, Iterable values,

Context context) throws IOException, InterruptedException {

for (IntWritable val : values) {

context.write(linenum, key);

linenum = new IntWritable(linenum.get() + 1);

}

}

}

输出如下：

[plain]

1 2

2 6

3 15

4 22

5 26

6 32

7 32

8 54

9 92

10 650

11 654

12 756

13 5956

14 65223

相關標籤：

hadoop mapreduce 排序數據

上一篇：postgresql system columns 下一篇：hadoop mapreduce求平均分

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

什麼是 NullPointerException，如何修復它？

2024-10-22 09:46:29
從新手到程式設計師：您的旅程從 C 基礎知識開始

2024-10-13 13:53:41
使用 PHP 解鎖 Web 開發：初學者指南

2024-10-12 12:15:51
揭秘 C：為新程式設計師提供一條清晰簡單的道路

2024-10-11 22:47:31
釋放您的編碼潛力：絕對初學者的 C 編程

2024-10-11 19:36:51
釋放你內心的程式設計師：C 絕對初學者

2024-10-11 15:50:41
使用 C 自動化您的生活：適合初學者的腳本和工具

2024-10-11 15:07:41
PHP 變得簡單：Web 開發的第一步

2024-10-11 14:21:21
使用 Python 建立任何東西：釋放創造力的初學者指南

2024-10-11 12:59:11
編碼的關鍵：為初學者釋放 Python 的力量

2024-10-11 12:17:31

最新問題

eclipse導入hadoop原始碼後，hadoop的bin目錄發生變化，少了我一些需要的腳本！

來自於 1970-01-01 08:00:00

0

0

0

字數統計-hadoop eclipse

來自於 1970-01-01 08:00:00

0

0

0

eclipse - hadoop原始碼bin目錄下找不到start-all.sh來啟動hadoop

來自於 1970-01-01 08:00:00

0

0

0

hadoop2.0 - eclipse閱讀hadoop原始碼求助

來自於 1970-01-01 08:00:00

0

0

0

求助，Eclipse如何關聯Hadoop的源碼

來自於 1970-01-01 08:00:00

0

0

0

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1432199
php入門教程之一週學會PHP

4287149
JAVA 初級入門影片教學

2618913
小甲魚零基礎入門學習Python影片教學

513422
PHP 零基礎入門教學

872497

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板