HBase MapReduce_2

HBase MapReduce_2 | 学习笔记

2022-10-21 111

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习 HBase MapReduce_2

开发者学堂课程【HBase入门教程：HBase MapReduce_2】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/397/detail/5097

一、例子

WCJob.java

public static void main(String[]args) throws Exception{

//默认加载 src 下的配置文件

Configuration conf= new Configuration();

conf.set("hbase.zookeeper.quorum","node1,node2,node3");

Job job=Job.getInstance(conf);

conf.set("mapred.jar","D:\\MR\\wc.jar");

Job job=Job.getInstance(comf);

job.setJarByCIass(WCJob.class);

job.setMapperClass(WCMap.class);

job.setMapOutputKeyClass(Text.class);

job.setMapoutputValueC1a8s(IntWritable.class);

FileInputFormat.addInputPath(jobnew Path ("/wc/ input/wc"));

// hbase reducer

String targetTable="wc";

TableMapReduceUtil.initTableReducerJob(

targetTable,

// reduce 输出的到哪一张表

WCTableReducer.class, // reducer class job);

boolean flag=job.waitForCompletion(true);

if (flag) {

System.out.println("job success ! ");

}

环境方式和 jdk 已经配置好了，并且需要修改源码。运行时候报错了，src 下需要加载文件，把配置文件先设置好，

还是放在 conf 下边，设置完成之后，再次执行，刷新之后，发现程序，还在 run

WCJob.java

public static void main(String[]args) throws Exception{

//默认加载 src 下的配置文件

Configuration conf= new Configuration();

conf.set("hbase.zookeeper.quorum","node1,node2,node3");

Job job=Job.getInstance(conf);

conf.set("mapred.jar","D:\\MR\\wc.jar");

Job job=Job.getInstance(comf);

job.setJarByCIass(WCJob.class);

job.setMapperClass(WCMap.class);

job.setMapOutputKeyClass(Text.class);

job.setMapoutputValueC1a8s(IntWritable.class);

FileInputFormat.addInputPath(jobnew Path ("/wc/ input/wc"));

// hbase reducer

String targetTable="wc";

TableMapReduceUtil.initTableReducerJob(

targetTable,

// reduce 输出的到哪一张表

WCTableReducer.class, // reducer class job);

boolean flag=job.waitForCompletion(true);

if (flag) {

System.out.println("job success ! ");

}

参数需要按照 TableReducer 这个规则来写，迭代器里有 values，map 输出之后，迭代器里有1，Bytes.toBytes (key.toString())往数据库里插一个数据，通过 bytes 转化成二进制数，把 key 这个单词作为 rokey，每个单词作为一行数据，列族写的是 cf，count 作为总数，定义一个变量位 count。需要创建一张表，这张表里列族名称是 cf。

创建一个表

输入：Creat ‘wc‘，’cf’

回车

0 row(s) in 0.4010 S ec onds

=> Hbase: : Table – wc

hbase( main) :005:0> list

TABLE

phone

tbl

wc

3 row(s) in 0.0080 sec onds

=>[ " phone"，"tbl", "wc" ]

hbase(main) :006 : 0> scan ‘wc’

ROW COLUMN+CELL

0 row(s) in 0.0190 seconds

hbase(main) 007 ; 0>

相关实践学习

lindorm多模间数据无缝流转

展现了Lindorm多模融合能力——用kafka API写入，无缝流转在各引擎内进行数据存储和计算的实验。

云数据库HBase版使用教程

  相关的阿里云产品：云数据库 HBase 版面向大数据领域的一站式NoSQL服务，100%兼容开源HBase并深度扩展，支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力，是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库，是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验：数据库上云实战开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引，您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。点击下方链接，领取免费ECS&RDS资源，30分钟完成数据库上云实战！https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl

HBase MapReduce_2 | 学习笔记