使用Python編寫MapReduce作業

高洛峰
發布: 2016-10-18 10:28:52
原創
1389 人瀏覽過

mrjob 可以讓用Python 2.5+ 來編寫MapReduce 作業,並在多個不同平台上運行,你可以:

使用純Python 編寫多步驟的MapReduce 作業

在本機上進行測試

在Hadoop 叢集上運行

使用Amazon Elastic MapReduce (EMR) 在雲端上運行

pip 的安裝方法非常簡單,無需配置,直接運行:pip install mrjob

程式碼實例:

from mrjob.job import MRJob
class MRWordCounter(MRJob):
    def mapper(self, key, line):
        for word in line.split():
            yield word, 1
    def reducer(self, word, occurrences):
        yield word, sum(occurrences)
if __name__ == '__main__':
    MRWordCounter.run()
登入後複製


🎜
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新問題
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板