Hbase的协处理器-tutorial mysql-php.cn

Jadual Kandungan

3.1观察者(Observer)

3.2终端(Endpoint)

4.3 典型例子

4.4索引表的使用 " >4.4索引表的使用

4.5使用时注意 " >4.5使用时注意

4.6效率情况 " >4.6效率情况

4.7Coprocessor二级索引方案优劣 " >4.7Coprocessor二级索引方案优劣

Rumah

pangkalan data

tutorial mysql

Hbase的协处理器

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 02:50 PM

hbase pemproses

1.起因(Why HBase Coprocessor) HBase作为列族数据库最经常被人诟病的特性包括：无法轻易建立“二级索引”，难以执行求和、计数、排序等操作。比如，在旧版本的(0.92)Hbase中，统计数据表的总行数，需要使用Counter方法，执行一次MapReduce Job才能得到。虽

1.起因(Why HBase Coprocessor)

HBase作为列族数据库最经常被人诟病的特性包括：无法轻易建立“二级索引”，难以执行求和、计数、排序等操作。比如，在旧版本的(

2.灵感来源( Source of Inspration)

HBase协处理器的灵感来自于Jeff Dean 09年的演讲( P66-67)。它根据该演讲实现了类似于bigtable的协处理器，包括以下特性:

每个表服务器的任意子表都可以运行代码
客户端的高层调用接口(客户端能够直接访问数据表的行地址，多行读写会自动分片成多个并行的RPC调用)
提供一个非常灵活的、可用于建立分布式服务的数据模型
能够自动化扩展、负载均衡、应用请求路由

HBase的协处理器灵感来自bigtable，但是实现细节不尽相同。HBase建立了一个框架，它为用户提供类库和运行时环境，使得他们的代码能够在HBase region server和master上处理。

3.细节剖析（Implementation)

协处理器分两种类型，系统协处理器可以全局导入region server上的所有数据表，表协处理器即是用户可以指定一张表使用协处理器。协处理器框架为了更好支持其行为的灵活性，提供了两个不同方面的插件。一个是观察者（observer），类似于关系数据库的触发器。另一个是终端(endpoint)，动态的终端有点像存储过程。

3.1观察者(Observer)

观察者的设计意图是允许用户通过插入代码来重载协处理器框架的upcall方法，而具体的事件触发的callback方法由HBase的核心代码来执行。协处理器框架处理所有的callback调用细节，协处理器自身只需要插入添加或者改变的功能。

以HBase0.92版本为例，它提供了三种观察者接口：

RegionObserver：提供客户端的数据操纵事件钩子：Get、Put、Delete、Scan等。
WALObserver：提供WAL相关操作钩子。
MasterObserver：提供DDL-类型的操作钩子。如创建、删除、修改数据表等。

这些接口可以同时使用在同一个地方，按照不同优先级顺序执行.用户可以任意基于协处理器实现复杂的HBase功能层。HBase有很多种事件可以触发观察者方法，这些事件与方法从HBase0.92版本起，都会集成在HBase API中。不过这些API可能会由于各种原因有所改动，不同版本的接口改动比较大，具体参考Java Doc。

RegionObserver工作原理，如图1所示。更多关于Observer细节请参见HBaseBook的第9.6.3章节。

图1 RegionObserver工作原理

3.2终端(Endpoint)

终端是动态RPC插件的接口，它的实现代码被安装在服务器端，从而能够通过HBase RPC唤醒。客户端类库提供了非常方便的方法来调用这些动态接口，它们可以在任意时候调用一个终端，它们的实现代码会被目标region远程执行，结果会返回到终端。用户可以结合使用这些强大的插件接口，为HBase添加全新的特性。终端的使用，如下面流程所示：

定义一个新的protocol接口，必须继承CoprocessorProtocol.
实现终端接口，该实现会被导入region环境执行。
继承抽象类BaseEndpointCoprocessor.
在客户端，终端可以被两个新的HBase Client API调用。单个region：HTableInterface.coprocessorProxy(Class protocol, byte[] row) 。rigons区域：HTableInterface.coprocessorExec(Class protocol, byte[] startKey, byte[] endKey, Batch.Call callable)

整体的终端调用过程范例，如图2所示：

图2 终端调用过程范例

4.编程实践(Code Example)

在该实例中，我们通过计算HBase表中行数的一个实例，来真实感受协处理器的方便和强大。在旧版的HBase我们需要编写MapReduce代码来汇总数据表中的行数，在0.92以上的版本HBase中，只需要编写客户端的代码即可实现，非常适合用在WebService的封装上。

4.1启用协处理器 Aggregation(Enable Coprocessor Aggregation)

我们有两个方法：1.启动全局aggregation，能过操纵所有的表上的数据。通过修改hbase-site.xml这个文件来实现，只需要添加如下代码：

<span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)"><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(128,0,0)">property</span><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)">></span>
   <span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)"><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(128,0,0)">name</span><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)">></span>hbase.coprocessor.user.region.classes<span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)"></span><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(128,0,0)">name</span><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)">></span>
   <span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)"><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(128,0,0)">value</span><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)">></span>org.apache.hadoop.hbase.coprocessor.AggregateImplementation<span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)"></span><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(128,0,0)">value</span><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)">></span>
 <span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)"></span><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(128,0,0)">property</span><span style="margin:0px; padding:0px; line-height:1.8; color:rgb(0,0,255)">></span></span></span></span>

Salin selepas log masuk

2.启用表aggregation，只对特定的表生效。通过HBase Shell 来实现。

(1)disable指定表。hbase> disable 'mytable'

(2)添加aggregation hbase> alter 'mytable', METHOD => 'table_att','coprocessor'=>'|org.apache.hadoop.hbase.coprocessor.AggregateImplementation||'

(3)重启指定表 hbase> enable 'mytable'

4.2统计行数代码(Code Snippet)

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.client.coprocessor.AggregationClient;
import org.apache.hadoop.hbase.client.coprocessor.LongColumnInterpreter;
import org.apache.hadoop.hbase.coprocessor.ColumnInterpreter;
import org.apache.hadoop.hbase.util.Bytes;

public class MyAggregationClient {

	private static final byte[] TABLE_NAME = Bytes.toBytes("bigtable1w");
	private static final byte[] CF = Bytes.toBytes("bd");
	public static void main(String[] args) throws Throwable {
	Configuration customConf = new Configuration();
	customConf.set("hbase.zookeeper.quorum",
	"192.168.58.101");
	//提高RPC通信时长
	customConf.setLong("hbase.rpc.timeout", 600000);
	//设置Scan缓存
	customConf.setLong("hbase.client.scanner.caching", 1000);
	Configuration configuration = HBaseConfiguration.create(customConf);
	AggregationClient aggregationClient = new AggregationClient(
	configuration);
	Scan scan = new Scan();
	//指定扫描列族，唯一值
	scan.addFamily(CF);
	//long rowCount = aggregationClient.rowCount(TABLE_NAME, null, scan);
	long rowCount = aggregationClient.rowCount(TableName.valueOf("bigtable1w"), new LongColumnInterpreter(), scan);
	System.out.println("row count is " + rowCount);

	}
	


}

Salin selepas log masuk

4.3 典型例子

协处理器其中的一个作用是使用Observer创建二级索引。先举个实际例子：
我们要查询指定店铺指定客户购买的订单，首先有一张订单详情表，它以被处理后的订单id作为rowkey；其次有一张以客户nick为rowkey的索引表，结构如下：

rowkey family
dp_id+buy_nick1 tid1:null tid2:null ...
dp_id+buy_nick2 tid3:null
...
该表可以通过Coprocessor来构建，实例代码：

[html] view plain copy 在CODE上查看代码片

public class TestCoprocessor extends BaseRegionObserver {
@Override
public void prePut(final ObserverContextRegionCoprocessorEnvironment> e,
final Put put, final WALEdit edit, final boolean writeToWAL)
throws IOException {
Configuration conf = new Configuration();
HTable table = new HTable(conf, "index_table");
ListKeyValue> kv = put.get("data".getBytes(), "name".getBytes());
IteratorKeyValue> kvItor = kv.iterator();
while (kvItor.hasNext()) {
KeyValue tmp = kvItor.next();
Put indexPut = new Put(tmp.getValue());
indexPut.add("index".getBytes(), tmp.getRow(), Bytes.toBytes(System.currentTimeMillis()));
table.put(indexPut);
}
table.close();
}
}

即继承BaseRegionObserver类，实现prePut方法，在插入订单详情表之前，向索引表插入索引数据。

4.4索引表的使用

先在索引表get索引表，获取tids，然后根据tids查询订单详情表。
当有多个查询条件（多张索引表），根据逻辑运算符（and 、or）确定tids。

4.5使用时注意

1.索引表是一张普通的hbase表，为安全考虑需要开启Hlog记录日志。
2.索引表的rowkey最好是不可变量，避免索引表中产生大量的脏数据。
3.如上例子，column是横向扩展的（宽表），rowkey设计除了要考虑region均衡，也要考虑column数量，即表不要太宽。建议不超过3位数。
4.如上代码，一个put操作其实是先后向两张表put数据，为保证一致性，需要考虑异常处理，建议异常时重试。

4.6效率情况

put操作效率不高，如上代码，每插入一条数据需要创建一个新的索引表连接（可以使用htablepool优化），向索引表插入数据。即耗时是双倍的，对hbase的集群的压力也是双倍的。当索引表有多个时，压力会更大。
查询效率比filter高，毫秒级别，因为都是rowkey的查询。
如上是估计的效率情况，需要根据实际业务场景和集群情况而定，最好做预先测试。

4.7Coprocessor二级索引方案优劣

优点：在put压力不大、索引region均衡的情况下，查询很快。
缺点：业务性比较强，若有多个字段的查询，需要建立多张索引表，需要保证多张表的数据一致性，且在hbase的存储和内存上都会有更高的要求

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7480

Tutorial CakePHP

1377

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Skor larian AMD Ryzen 9900X, 9700X, 9600X Cinebench R23 didedahkan, dengan peningkatan purata 10~15% Jul 29, 2024 am 11:38 AM

Menurut berita dari laman web ini pada 29 Julai, pemproses siri AMD Ryzen 9000 kini tersedia untuk tempahan di JD.com Kumpulan pertama empat model akan dilancarkan dan akan dikeluarkan pada 15 Ogos. Data penilaian pemproses ini akan ditarik balik pada 14 Ogos, sehari sebelum mereka mula dijual Walau bagaimanapun, beberapa media atau institusi telah mendapatkan sampel terlebih dahulu dan mula menguji, jadi data skor larian bagi pemproses R99900X, R79700X dan R59600X telah. telah bocor. ▲Sumber gambar: @9550pro Secara keseluruhan, peralihan daripada Zen4 ke Zen5 dijangka membawa peningkatan 10% hingga 15% dalam prestasi teras tunggal dan peningkatan 10% hingga 13% dalam prestasi berbilang teras, tetapi TDP agak lebih rendah daripada siri Ryzen 7000 Reduced, yang juga sejajar dengan data peningkatan IPC rasmi AMD. Ryzen

Pengukuran sebenar Jingyue: AMD R7 8700F, R5 8400F prestasi pemproses grafik tanpa teras adalah serupa dengan 8700G dan 7500F Apr 06, 2024 am 09:01 AM

Menurut berita dari laman web ini pada 5 April, Jingyue secara rasmi mengesahkan bahawa pemproses grafik tanpa teras AMDR78700F dan R58400F yang didedahkan bulan lepas adalah model yang dibekalkan khas ke China, dan mengeluarkan video ujian pertama pada keseluruhan rangkaian, mengesahkan bahawa kedua-duanya tidak mempunyai grafik teras dan TDP Konfigurasi semuanya 65W. Dari segi spesifikasi, AMD Ryzen78700F mempunyai 8 teras dan 16 utas, frekuensi asas 4.1GHz, frekuensi pecutan 5.05GHz, iaitu 0.10/0.05GHz lebih rendah daripada Ryzen78700G, dan dilengkapi dengan cache 16MB L3. AMD Ryzen58400F menggunakan reka bentuk 6-teras 12-benang dengan frekuensi 4.2~4.75GHz Berbanding dengan R57500F, frekuensi asas ditingkatkan sebanyak 0.1GHz dan kekerapan pecutan dikurangkan sebanyak 0.

144-teras, SRAM bertindan 3D: Fujitsu memperincikan pemproses pusat data generasi akan datang MONAKA Jul 29, 2024 am 11:40 AM

Menurut berita dari laman web ini pada 28 Julai, media asing TechRader melaporkan bahawa Fujitsu memperkenalkan secara terperinci pemproses FUJITSU-MONAKA (selepas ini dirujuk sebagai MONAKA) yang dirancang untuk dihantar pada 2027. MONAKACPU adalah berdasarkan seni bina "3D asli awan" dan menggunakan set arahan Arm Ia berorientasikan pusat data, tepi dan medan telekomunikasi Ia sesuai untuk pengkomputeran AI dan boleh merealisasikan RAS1 peringkat kerangka utama. Fujitsu berkata bahawa MONAKA akan mencapai lonjakan dalam kecekapan dan prestasi tenaga: terima kasih kepada teknologi seperti teknologi voltan ultra-rendah (ULV), CPU boleh mencapai kecekapan tenaga 2 kali ganda produk pesaing pada tahun 2027, dan penyejukan tidak memerlukan penyejukan air. ; sebagai tambahan, prestasi aplikasi pemproses Ia juga boleh mencapai dua kali lebih banyak daripada lawan anda. Dari segi arahan, MONAKA dilengkapi dengan vektor

AMD Ryzen 9 9950X overclock kepada 6.6 GHz, CineBench R23 mencapai skor maksimum 55296 mata Jul 17, 2024 pm 09:49 PM

Menurut berita dari laman web ini pada 16 Julai, pasukan AMDXOC menunjukkan pemproses overclocking Ryzen 99950X untuk media dan tetamu jemputan pada Hari Teknologi Zen5 Pemproses telah di-overclock menggunakan nitrogen cecair (LN2) dan mendapat lebih daripada 5.5 dalam CineBenchR23 juta. dan penggunaan kuasa setinggi 552W. Platform overclocking yang digunakan oleh pasukan XOC ialah motherboard ASUS X670EROG CorsshairGene, iaitu motherboard yang direka khas untuk pemain overclocking dan dilengkapi dengan 2 DDR5DIMM. Selepas menggunakan nitrogen cecair, suhu operasi pemproses Ryzen 99950X turun kepada tolak 90 darjah Celsius, penggunaan kuasa adalah 552W, CPU telah overclock pada 6.4GHz, dan skor dalam CineBenchR23 melebihi 55296

Berbilang teras melebihi 100,000, skor larian CPU-Z pemproses AMD EPYC 9755 terdedah: 14% lebih pantas daripada EPYC 9654 Jul 25, 2024 am 10:46 AM

Menurut berita dari laman web ini pada 25 Julai, sumber HXL (@9550pro) tweet semalam (24 Julai), berkongsi maklumat mengenai CPU AMDEPYC9755 "Turin" berasaskan Zen5, yang mencapai keputusan cemerlang dalam ujian penanda aras CPU-Z . Maklumat CPU AMDEPYC9755 "Turin" EPYC9755 ialah produk keluarga EPYC generasi kelima AMD, dilengkapi dengan 128 teras dan 256 utas pada seni bina Zen5. Kekerapan jam asas pemproses EPYC9755 ialah 2.70GHz, dan frekuensi jam pecutan boleh mencapai 4.10GHz Berbanding dengan generasi sebelumnya, bilangan teras/benang telah meningkat sebanyak 33%, dan kekerapan jam telah meningkat sebanyak 11%. EPYC9755

Pemproses AMD Ryzen 7 9700X muncul di Geekbench: skor larian teras tunggal adalah 14% lebih tinggi daripada R7 7700X Jul 12, 2024 pm 01:59 PM

Menurut berita dari laman web ini pada 9 Julai, mesin ujian ASUS yang dilengkapi dengan pemproses AMD Ryzen 79700X muncul dalam pangkalan data Geekbench, dilengkapi dengan papan induk ROG CROSSHAIRX670EHERO dan memori 32GBDDR56000. AMD Ryzen 79700X mempunyai 8 teras dan 16 benang, frekuensi asas 3.8GHz, kekerapan pecutan 5.5GHz, cache 40MB (nota tapak ini: 32MBL3+8MBL2) dan reka bentuk TDP 65W, tetapi terdapat juga berita bahawa AMD telah meningkatkan TDPnya kepada 120W . Seperti yang ditunjukkan dalam rajah, platform ujian menjalankan skor tunggal dan berbilang teras sebanyak 3312 mata dan 16431 mata pada Geekbench6.3.0, yang lebih baik daripada R77700

AMD mengumumkan kerentanan keterukan tinggi 'Sinkclose', menjejaskan berjuta-juta pemproses Ryzen dan EPYC Aug 10, 2024 pm 10:31 PM

Menurut berita dari laman web ini pada 10 Ogos, AMD secara rasmi mengesahkan bahawa beberapa pemproses EPYC dan Ryzen mempunyai kelemahan baharu yang dipanggil "Sinkclose" dengan kod "CVE-2023-31315", yang mungkin melibatkan berjuta-juta pengguna AMD di seluruh dunia. Jadi, apakah itu Sinkclose? Menurut laporan oleh WIRED, kerentanan itu membenarkan penceroboh menjalankan kod hasad dalam "Mod Pengurusan Sistem (SMM)." Didakwa, penceroboh boleh menggunakan jenis perisian hasad yang dipanggil bootkit untuk mengawal sistem pihak lain, dan perisian hasad ini tidak dapat dikesan oleh perisian anti-virus. Nota dari tapak ini: Mod Pengurusan Sistem (SMM) ialah mod kerja CPU khas yang direka untuk mencapai pengurusan kuasa lanjutan dan fungsi bebas sistem pengendalian.

Pemproses Kirin 8000 bersaing dengan siri Snapdragon: Siapa yang boleh menjadi raja? Mar 25, 2024 am 09:03 AM

Dalam era Internet mudah alih, telefon pintar telah menjadi bahagian yang sangat diperlukan dalam kehidupan seharian manusia. Prestasi telefon pintar selalunya secara langsung menentukan kualiti pengalaman pengguna. Sebagai "otak" telefon pintar, prestasi pemproses amat penting. Di pasaran, siri Qualcomm Snapdragon sentiasa mewakili prestasi kukuh, kestabilan dan kebolehpercayaan, dan baru-baru ini Huawei turut melancarkan pemproses Kirin 8000 sendiri, yang dikatakan mempunyai prestasi cemerlang. Bagi pengguna biasa, cara memilih telefon bimbit dengan prestasi yang kukuh telah menjadi isu utama. Hari ini kita akan

See all articles