目次
1、hbase.regionserver.handler.count
2、hfile.block.cache.size
3、hbase.regionserver.global.memstore.upperLimit
4、hbase.regionserver.global.memstore.lowerLimit
5、hbase.hstore.blockingStoreFiles
6、hbase.hregion.memstore.flush.size、hbase.hregion.memstore.block.multiplier
7、hbase.regionserver.checksum.verify
8、hbase.hregion.max.filesize
9、谈谈region数量设置、以及region split过程

hbase优化相关参数说明

Jun 07, 2016 pm 03:29 PM
hbase 最適化 パラメータ 関連している 説明する

1、hbase.regionserver.handler.count RegionServers处理远程请求的线程数,如果注重TPS,可以调大,默认10 note1:设得越大,意味着内存开销变大,hbase.client.write.buffer * hbase.regionserver.handler.count,hbase.client.write.buffer默认大小为2M n

1、hbase.regionserver.handler.count

RegionServers处理远程请求的线程数,如果注重TPS,可以调大,默认10 note1:值设得越大,意味着内存开销变大,hbase.client.write.buffer * hbase.regionserver.handler.count,hbase.client.write.buffer默认大小为2M note2: 对于提高write的速度,如果瓶颈在做flush、compact、split的速度,磁盘io跟不上,提高线程数,意义不大。

2、hfile.block.cache.size

默认0.25,hfile/StoreFile的最大读缓存空间,所占堆空间比例。 note1:参数设定根据应用场景,如果读比写多,建议调大,读写平衡,建议设成0.3,如果读少于写,建议调小 note2:block.cache.size memstore limits 这些内存加起来不要超过60%。因为剩余的内存还要用来做其他事情。否则容易OOM。

3、hbase.regionserver.global.memstore.upperLimit

默认0.4,memstores所占最大堆空间比例,如果达到上限,阻塞更新,强制flush数据

4、hbase.regionserver.global.memstore.lowerLimit

默认0.35,menstores达到上限,做flush,知道memstores降到该值,停止flush。

5、hbase.hstore.blockingStoreFiles

默认7,如果一个hstore里面storefile超过这个数字(每次memstore做flush时会生成一个hstore),会阻塞相应hregion的更新,知道一个compact压缩过程结束,或者阻塞时间超过hbase.hstore.blockingWaitTime(默认90s) note1:hbase.hstore.compactionThreshold,默认3,如果一个hstore里面的storefile数量超过这个数字,一个压缩任务会启动,将所有的storefile合并成一个。如果数量较多,那么会推迟合并过程,但是再执行时,将会消耗更多时间。 note2:对于持续写的系统,这个参数的设置,是为了compact与flush的速度平衡,如果compact的速度远小于flush的速度,有可能造成 文件io过多,造成too many openfile异常,以及给namenode带来更大的压力。

6、hbase.hregion.memstore.flush.size、hbase.hregion.memstore.block.multiplier

默认134217728、2 第一个参数:如果一个memstore大小超过flushsize,则启动flush。后台会有一个线程在周期hbase.server.thread.wakefrequency内,定时检查 第二个参数:如果一个memstore大小超过 该值*flushsize,则阻塞更新。该参数可以平衡,写入速度、flush速度、compact速度、split速度

7、hbase.regionserver.checksum.verify

默认false,决定,hbase使用自己的数据校验,而不是hdfs的校验。

8、hbase.hregion.max.filesize

默认10G,一个region下,任一列簇的hfiles的大小,超过这个值,该region将split成2个region。 note:如果你的数据量增长的比较快,那么还是建议把这个大小调高,可以调成100G,因为越少的region你的集群越流畅,100G的阈值基本可以避免你的region增长过快,甚至你的region数目会长期不变。当然大region在compaction时也会更加缓慢。几十G的region启动和compaction都非常的慢,如果storefile较多,一个compaction可能会持续几天。

9、谈谈region数量设置、以及region split过程

个人观点,如果可以尽早对region进行规划,可以提前预判规划好region的数量,这样可以节省split带来的消耗。 note1:人工进行split 设置hbase.hregion.max.filesize的值为LONG.MAX_VALUE,但是建议设成一个较大的值。预先设计region数量为10,或者更少,然后看数据发展情况。 如果数据较少,可以讲major compact的周期调大。如果数据增长比较快,那么可以调用org.apache.hadoop.hbase.util.RegionSplitter接口,主动进行split。
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットな記事タグ

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

C++ 関数パラメータの型の安全性チェック C++ 関数パラメータの型の安全性チェック Apr 19, 2024 pm 12:00 PM

C++ 関数パラメータの型の安全性チェック

C++ プログラムの最適化: 時間の複雑さを軽減する手法 C++ プログラムの最適化: 時間の複雑さを軽減する手法 Jun 01, 2024 am 11:19 AM

C++ プログラムの最適化: 時間の複雑さを軽減する手法

C++ 関数での参照パラメータとポインタ パラメータの高度な使用法 C++ 関数での参照パラメータとポインタ パラメータの高度な使用法 Apr 21, 2024 am 09:39 AM

C++ 関数での参照パラメータとポインタ パラメータの高度な使用法

より見栄えの良い写真を撮るためにビューティーカメラのパラメータを調整する方法 ビューティーカメラの最適なパラメータの参考。 より見栄えの良い写真を撮るためにビューティーカメラのパラメータを調整する方法 ビューティーカメラの最適なパラメータの参考。 Mar 12, 2024 pm 02:07 PM

より見栄えの良い写真を撮るためにビューティーカメラのパラメータを調整する方法 ビューティーカメラの最適なパラメータの参考。

Vivox100s のパラメーター構成が明らかに: プロセッサーのパフォーマンスを最適化するには? Vivox100s のパラメーター構成が明らかに: プロセッサーのパフォーマンスを最適化するには? Mar 24, 2024 am 10:27 AM

Vivox100s のパラメーター構成が明らかに: プロセッサーのパフォーマンスを最適化するには?

WIN7システムのスタートアップ項目を最適化する方法 WIN7システムのスタートアップ項目を最適化する方法 Mar 26, 2024 pm 06:20 PM

WIN7システムのスタートアップ項目を最適化する方法

PHP 関数の非効率性を解決するにはどのような方法がありますか? PHP 関数の非効率性を解決するにはどのような方法がありますか? May 02, 2024 pm 01:48 PM

PHP 関数の非効率性を解決するにはどのような方法がありますか?

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ Apr 10, 2024 pm 03:16 PM

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ

See all articles