HBase MapReduce_1| 学习笔记

简介: 快速学习 HBase MapReduce_1

开发者学堂课程【HBase入门教程HBase MapReduce_1】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/397/detail/5096


HBase MapReduce_1


内容介绍

一、读表案例

二、写表案例


一、举例

下面的案例主要是如何 将 HBase 作为 MapReduce 源使用,如果,有 Mapper instance 但是没有 Reducer ,并且 Mapper 中没有任何发出的进程,此时代码应该如下:

Configuration config = HBaseConfiguration.create();

Job job=newJob(config,"ExampleRead");job.setJarByClass(MyReadJob.class);

// 包含  mapper 的类

Scan scan = new Scan();scan.setCaching(500);

// 1 是指浏览当中的错误,会对 MapReduce 进行有害

scan.setCacheBlocks(false);

//不要为 MR jobs 设置为

ture...TableMapReduceUtil.initTableMapperJob(tableName,

// 输入 HBase 表名称scan,            

MyMapper.class, // mappernull,

// mapper 主要输出null,

// mapper 输出内容

job);job.setOutputFormatClass(NullOutputFormat.class);

// 因为此时haimeiy9ou从 mapper 中发送出任何进程boolean b =

job.waitForCompletion(true);if (!b) {throw new IOException("error with job!");} public static class MyMapper extends TableMapper{public void map(ImmutableBytesWritable row, Result value,

//map 内可以按照自身需求填写Context context) throws InterruptedException, IOException {}}


二、书写案例

下面主要讲解,当 HBase 在  MapReduce 中, 即用来当做一个 source 由用来当做一个 sink,可以先直接把代码复制过来修改,代码如下:

Configuration config = HBaseConfiguration.create();Job job = new Job(config,"ExampleReadWrite");job.setJarByClass(MyReadWriteJob.class);

// 包含 mapper 的类

Scan scan = new Scan();

scan.setCaching(500);

// 1 是指浏览当中的错误,会对 MapReduce 进行有害

scan.setCacheBlocks(false);

// 不要为 MR jobs 设置为

ture TableMapReduceUtil.initTableMapperJob(sourceTable,

// 输入表scan,

MyMapper.class,

// mapper 类 null, // mapper 主要输出键 null,

// mapper 输出内容job);TableMapReduceUtil.initTableReducerJob(targetTable,

//输出表null,              

//reducer 类job);job.setNumReduceTasks(0); boolean b = job.waitForCompletion(true);if (!b) {throw new IOException("error with job!");}Reduce 为空,没有被指定,此例子中,只定义到了 map ,而没有指定到 reduce。

接下来下一个例子,代码如下

:TableMapReduceUtil.initTableMapperJob(sourceTable,

// 输入表 scan,

MyMapper.class,

// mapper 类 Text.class,

// mapper 输出关键字IntWritable.class,job);TableMapReduceUtil.initTableReducerJob(targetTable,

// 输出表

MyTableReducer.class,

// reducer 类 job);job.setNumReduceTasks(1);

// 要求至少调整一处

boolean b = job.waitForCompletion(true);if (!b) {throw new IOException("error with job!");}

这个案例中,指定了一个 MyTableReducer,在指定的时候,先指定了所要操作的目标表,还有 job reduce 方法,里面继承了 MyTableReduce reduce 在拿到数据之后,做累加,然后将键放到 put 中去,put 再进来之后,带上列族和字段,在放入 put 中,输出时,只将 put 输出,插入到 Hbase 的表当中。

此案例中,没看到表关联的原因是:在初始化时,写 reduce 的时候已经直接写入了,目标表已经被指定了。

而之前 map 指定的时候中的目标表,是读表目标,不是写表目标。

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
存储 SQL 自然语言处理
基于 HBase 的海量数据查询与检索解析|学习笔记
快速学习基于 HBase 的海量数据查询与检索解析
846 0
基于 HBase 的海量数据查询与检索解析|学习笔记
|
5月前
|
SQL 分布式计算 Hadoop
Hadoop学习笔记(HDP)-Part.16 安装HBase
01 关于HDP 02 核心组件原理 03 资源规划 04 基础环境配置 05 Yum源配置 06 安装OracleJDK 07 安装MySQL 08 部署Ambari集群 09 安装OpenLDAP 10 创建集群 11 安装Kerberos 12 安装HDFS 13 安装Ranger 14 安装YARN+MR 15 安装HIVE 16 安装HBase 17 安装Spark2 18 安装Flink 19 安装Kafka 20 安装Flume
83 1
Hadoop学习笔记(HDP)-Part.16 安装HBase
|
6月前
|
分布式计算 分布式数据库 Hbase
99 MapReduce操作Hbase
99 MapReduce操作Hbase
43 0
|
存储 前端开发 Cloud Native
基于 HBase 快速构架海量订单存储系统|学习笔记
快速学习基于 HBase 快速构架海量订单存储系统
346 0
基于 HBase 快速构架海量订单存储系统|学习笔记
|
SQL 存储 边缘计算
HBase&Hive 2(三)|学习笔记
快速学习 HBase&Hive 2(三)
107 0
HBase&Hive 2(三)|学习笔记
|
SQL 存储 分布式计算
HBase&Hive 2(二)|学习笔记
快速学习 HBase&Hive 2(二)
77 0
HBase&Hive 2(二)|学习笔记
|
存储 SQL 分布式计算
HBase&Hive 2(一)|学习笔记
快速学习 HBase&Hive 2(一)
96 0
HBase&Hive 2(一)|学习笔记
|
存储 SQL 缓存
HBase&HIve 1|学习笔记
快速学习 HBase&HIve 1
144 0
HBase&HIve 1|学习笔记
|
SQL 消息中间件 存储
基于 HBase 的大数据在线分析|学习笔记
快速学习基于 HBase 的大数据在线分析
343 0
基于 HBase 的大数据在线分析|学习笔记
|
存储 搜索推荐 Java
如何基于 HBase 构建图片、视频数据的统一存储检索方案|学习笔记
快速学习如何基于 HBase 构建图片、视频数据的统一存储检索方案
753 0
如何基于 HBase 构建图片、视频数据的统一存储检索方案|学习笔记