MR中Hbase的Scan使用技巧
Hadoop的MR运算中,Hbase可以作为输入数据源参与运算,其中作为HTable的迭代器Scan有几个使用技巧 涉及的方法如下: public void setBatch(int batch)public void setCaching(int caching)public void setCacheBlocks(boolean cacheBlocks) public void setB
Hadoop的MR运算中,Hbase可以作为输入数据源参与运算,其中作为HTable的迭代器Scan有几个使用技巧
涉及的方法如下:
public void setBatch(int batch) public void setCaching(int caching) public void setCacheBlocks(boolean cacheBlocks)
public void setBatch(int batch) :
为设置获取记录的列个数,默认无限制,也就是返回所有的列
public void setCaching(int caching):
每次从服务器端读取的行数,默认为配置文件中设置的值
public void setCacheBlocks(boolean cacheBlocks):
为是否缓存块,默认缓存,我们分内存,缓存和磁盘,三种方式,一般数据的读取为内存->缓存->磁盘,当MR的时候为非热点数据,因此不需要缓存
因此在MR的时候最好设置如下:
scan.setCacheBlocks(false); scan.setCaching(200);//大了占内存,但是rpc少 scan.setBatch(6);//你需要的列
?
已有 0 人发表留言,猛击->> 这里
ITeye推荐
- —软件人才免语言低担保 赴美带薪读研!—
原文地址:MR中Hbase的Scan使用技巧, 感谢原作者分享。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

Java错误:Hadoop错误,如何处理和避免当使用Hadoop处理大数据时,常常会遇到一些Java异常错误,这些错误可能会影响任务的执行,导致数据处理失败。本文将介绍一些常见的Hadoop错误,并提供处理和避免这些错误的方法。Java.lang.OutOfMemoryErrorOutOfMemoryError是Java虚拟机内存不足的错误。当Hadoop任

在现代金融领域中,随着数据科学和人工智能技术的兴起,量化金融逐渐成为了越来越重要的一个方向。而作为一门能够高效处理数据和部署分布式系统的静态类型编程语言,Go语言也逐渐受到了量化金融领域的关注。本文将介绍如何使用Go语言进行量化金融分析,具体内容如下:获取金融数据首先,我们需要获取金融数据。Go语言的网络编程能力非常强大,可以用来获取各种金融数据。比

如何使用PHP开发简单的SEO优化功能SEO(SearchEngineOptimization)即搜索引擎优化,是指通过改进网站的结构和内容来提高网站在搜索引擎中的排名,从而获得更多的有机流量。在网站开发中,如何使用PHP来实现简单的SEO优化功能呢?本文将介绍一些常用的SEO优化技巧和具体的代码示例,帮助开发者在PHP项目中实现SEO优化。一、使用友好

如何使用C#编写最小生成树算法最小生成树算法是一种重要的图论算法,它用于解决图的连通性问题。在计算机科学中,最小生成树是指一个连通图的生成树,该生成树的所有边的权值之和最小。本文将介绍如何使用C#编写最小生成树算法,并提供具体的代码示例。首先,我们需要定义一个图的数据结构来表示问题。在C#中,可以使用邻接矩阵来表示图。邻接矩阵是一个二维数组,其中每个元素表示

随着互联网的普及,越来越多的网站提供了图片、视频等资源的外链功能。然而,这种外链功能却容易被盗链。盗链是指其它网站利用你网站上的图片、视频等资源,直接通过引用地址在自己的网站显示这些资源,而不是将其下载到自己的服务器上。这样一来,盗链网站就可以免费使用你网站的流量和带宽资源,这既浪费资源又影响网站速度。针对这种问题,可以使用Nginx进行防盗链。Nginx是

一键解决:快速掌握pip镜像源的使用技巧导语:pip是Python最常用的包管理工具,可以方便地安装、升级和管理Python包。然而,由于众所周知的原因,使用默认的镜像源下载安装包速度较慢,为了解决这个问题,我们需要使用国内的镜像源。本文将介绍如何快速掌握pip镜像源的使用技巧,并提供具体的代码示例。了解pip镜像源的概念在开始之前,先来了

随着大数据时代的到来,数据处理和存储变得越来越重要,如何高效地管理和分析大量的数据也成为企业面临的挑战。Hadoop和HBase作为Apache基金会的两个项目,为大数据存储和分析提供了一种解决方案。本文将介绍如何在Beego中使用Hadoop和HBase进行大数据存储和查询。一、Hadoop和HBase简介Hadoop是一个开源的分布式存储和计算系统,它可

Oracle数据库作为一种功能强大的关系型数据库管理系统,提供了丰富的运算操作来满足用户的需求。在日常的数据库操作中,减法操作是一个常见且重要的运算,它能够帮助我们实现数据的减法运算,从而得到我们所需的结果。本文将详细讨论Oracle数据库中减法操作的相关技巧,并给出具体的代码示例,帮助读者更好地理解和运用这一功能。1.减法操作的基本概念在Oracle数据
