Rumah pangkalan data tutorial mysql MR中Hbase的Scan使用技巧

MR中Hbase的Scan使用技巧

Jun 07, 2016 pm 04:30 PM
hadoop hbase scan Petua Operasi

Hadoop的MR运算中,Hbase可以作为输入数据源参与运算,其中作为HTable的迭代器Scan有几个使用技巧 涉及的方法如下: public void setBatch(int batch)public void setCaching(int caching)public void setCacheBlocks(boolean cacheBlocks) public void setB

Hadoop的MR运算中,Hbase可以作为输入数据源参与运算,其中作为HTable的迭代器Scan有几个使用技巧

涉及的方法如下:

public void setBatch(int batch)
public void setCaching(int caching)
public void setCacheBlocks(boolean cacheBlocks)
Salin selepas log masuk

public void setBatch(int batch) :

为设置获取记录的列个数,默认无限制,也就是返回所有的列

public void setCaching(int caching):

每次从服务器端读取的行数,默认为配置文件中设置的值

public void setCacheBlocks(boolean cacheBlocks):

为是否缓存块,默认缓存,我们分内存,缓存和磁盘,三种方式,一般数据的读取为内存->缓存->磁盘,当MR的时候为非热点数据,因此不需要缓存

因此在MR的时候最好设置如下:

scan.setCacheBlocks(false);
scan.setCaching(200);//大了占内存,但是rpc少
scan.setBatch(6);//你需要的列
Salin selepas log masuk

?



已有 0 人发表留言,猛击->> 这里

ITeye推荐
  • —软件人才免语言低担保 赴美带薪读研!—



MR中Hbase的Scan使用技巧

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Repo: Cara menghidupkan semula rakan sepasukan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Cara mendapatkan biji gergasi
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Ralat Java: Ralat Hadoop, Cara Mengendalikan dan Mengelak Ralat Java: Ralat Hadoop, Cara Mengendalikan dan Mengelak Jun 24, 2023 pm 01:06 PM

Ralat Java: Ralat Hadoop, Cara Mengendalikan dan Mengelak Apabila menggunakan Hadoop untuk memproses data besar, anda sering menghadapi beberapa ralat pengecualian Java, yang mungkin menjejaskan pelaksanaan tugas dan menyebabkan pemprosesan data gagal. Artikel ini akan memperkenalkan beberapa ralat Hadoop biasa dan menyediakan cara untuk menangani dan mengelakkannya. Java.lang.OutOfMemoryErrorOutOfMemoryError ialah ralat yang disebabkan oleh memori mesin maya Java yang tidak mencukupi. Apabila Hadoop adalah

Bagaimana untuk menggunakan bahasa Go untuk analisis kewangan kuantitatif? Bagaimana untuk menggunakan bahasa Go untuk analisis kewangan kuantitatif? Jun 11, 2023 am 08:51 AM

Dalam bidang kewangan moden, dengan peningkatan sains data dan teknologi kecerdasan buatan, kewangan kuantitatif secara beransur-ansur menjadi arah yang semakin penting. Sebagai bahasa pengaturcaraan ditaip secara statik yang boleh memproses data dengan cekap dan menggunakan sistem teragih, bahasa Go secara beransur-ansur menarik perhatian dalam bidang kewangan kuantitatif. Artikel ini akan memperkenalkan cara menggunakan bahasa Go untuk melakukan analisis kewangan kuantitatif Kandungan khusus adalah seperti berikut: Mendapatkan data kewangan Pertama, kita perlu mendapatkan data kewangan. Keupayaan pengaturcaraan rangkaian bahasa Go sangat berkuasa dan boleh digunakan untuk mendapatkan pelbagai data kewangan. Bandingkan

Cara menggunakan PHP untuk membangunkan fungsi pengoptimuman SEO mudah Cara menggunakan PHP untuk membangunkan fungsi pengoptimuman SEO mudah Sep 20, 2023 pm 04:18 PM

Cara menggunakan PHP untuk membangunkan fungsi pengoptimuman SEO mudah SEO (SearchEngineOptimization), atau pengoptimuman enjin carian, merujuk kepada meningkatkan kedudukan laman web dalam enjin carian dengan menambah baik struktur dan kandungan laman web, dengan itu memperoleh lebih banyak trafik organik. Dalam pembangunan laman web, bagaimana untuk menggunakan PHP untuk melaksanakan fungsi pengoptimuman SEO yang mudah? Artikel ini akan memperkenalkan beberapa teknik pengoptimuman SEO yang biasa digunakan dan contoh kod khusus untuk membantu pembangun melaksanakan pengoptimuman SEO dalam projek PHP. 1. Penggunaan yang mesra

Cara menggunakan nginx untuk mengelakkan hotlinking Cara menggunakan nginx untuk mengelakkan hotlinking Jun 11, 2023 pm 01:25 PM

Dengan populariti Internet, semakin banyak laman web menyediakan fungsi pautan luaran untuk gambar, video dan sumber lain. Walau bagaimanapun, fungsi pautan luaran ini mudah dicuri. Hotlinking bermaksud tapak web lain menggunakan gambar, video dan sumber lain di tapak web anda untuk memaparkan terus sumber ini di tapak web mereka sendiri melalui alamat rujukan dan bukannya memuat turunnya ke pelayan mereka sendiri. Dengan cara ini, tapak web pautan panas boleh menggunakan trafik tapak web anda dan sumber lebar jalur secara percuma, yang membazir sumber dan menjejaskan kelajuan tapak web. Untuk menangani masalah ini, Nginx boleh digunakan untuk menghalang hotlinking. Nginx adalah

Bagaimana untuk menulis algoritma pokok rentang minimum menggunakan C# Bagaimana untuk menulis algoritma pokok rentang minimum menggunakan C# Sep 19, 2023 pm 01:55 PM

Cara menggunakan C# untuk menulis algoritma pepohon rentang minimum Algoritma pepohon rentang minimum ialah algoritma teori graf yang penting, yang digunakan untuk menyelesaikan masalah ketersambungan graf. Dalam sains komputer, pokok rentang minimum merujuk kepada pokok rentang bagi graf bersambung di mana jumlah pemberat semua tepi pokok rentang adalah yang terkecil. Artikel ini akan memperkenalkan cara menggunakan C# untuk menulis algoritma pepohon rentang minimum dan memberikan contoh kod khusus. Pertama, kita perlu mentakrifkan struktur data graf untuk mewakili masalah. Dalam C#, anda boleh menggunakan matriks bersebelahan untuk mewakili graf. Matriks bersebelahan ialah tatasusunan dua dimensi di mana setiap elemen mewakili

Kemahiran operasi pangkalan data Oracle: penerangan terperinci tentang operasi tolak Kemahiran operasi pangkalan data Oracle: penerangan terperinci tentang operasi tolak Mar 02, 2024 pm 06:15 PM

Sebagai sistem pengurusan pangkalan data hubungan yang berkuasa, pangkalan data Oracle menyediakan banyak operasi pengkomputeran untuk memenuhi keperluan pengguna. Dalam operasi pangkalan data harian, operasi penolakan adalah operasi biasa dan penting. Ia boleh membantu kami merealisasikan operasi penolakan data untuk mendapatkan hasil yang kami perlukan. Artikel ini akan membincangkan secara terperinci teknik yang berkaitan dengan operasi penolakan dalam pangkalan data Oracle, dan memberikan contoh kod khusus untuk membantu pembaca memahami dan menggunakan fungsi ini dengan lebih baik. 1. Konsep asas operasi tolak dalam data Oracle

Menggunakan Hadoop dan HBase dalam Beego untuk penyimpanan data besar dan pertanyaan Menggunakan Hadoop dan HBase dalam Beego untuk penyimpanan data besar dan pertanyaan Jun 22, 2023 am 10:21 AM

Dengan kemunculan era data besar, pemprosesan dan penyimpanan data menjadi semakin penting, dan cara mengurus dan menganalisis sejumlah besar data dengan cekap telah menjadi cabaran bagi perusahaan. Hadoop dan HBase, dua projek Yayasan Apache, menyediakan penyelesaian untuk penyimpanan dan analisis data besar. Artikel ini akan memperkenalkan cara menggunakan Hadoop dan HBase dalam Beego untuk storan dan pertanyaan data besar. 1. Pengenalan kepada Hadoop dan HBase Hadoop ialah sistem storan dan pengkomputeran teragih sumber terbuka yang boleh

Cara menggunakan PHP dan Hadoop untuk pemprosesan data besar Cara menggunakan PHP dan Hadoop untuk pemprosesan data besar Jun 19, 2023 pm 02:24 PM

Memandangkan jumlah data terus meningkat, kaedah pemprosesan data tradisional tidak lagi dapat menangani cabaran yang dibawa oleh era data besar. Hadoop ialah rangka kerja pengkomputeran teragih sumber terbuka yang menyelesaikan masalah kesesakan prestasi yang disebabkan oleh pelayan nod tunggal dalam pemprosesan data besar melalui storan teragih dan pemprosesan sejumlah besar data. PHP adalah bahasa skrip yang digunakan secara meluas dalam pembangunan web dan mempunyai kelebihan pembangunan pesat dan penyelenggaraan yang mudah. Artikel ini akan memperkenalkan cara menggunakan PHP dan Hadoop untuk pemprosesan data besar. Apa itu HadoopHadoop

See all articles