Spark On HBase Idea远程调试-阿里云开发者社区

Spark On HBase Idea远程调试

2019-04-03 1585

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文介绍如何在本地IDEA远程调试Spark On HBase。前提条件： 1、已经安装了Intellij IDEA，Git、Maven。2、HBase集群开通了外网地址。3、HBase集群为IDEA运行的机器开通了白名单。

本文介绍如何在本地IDEA远程调试Spark On HBase。

前提条件：

1、已经安装了Intellij IDEA，Git、Maven。
2、HBase集群开通了外网地址。
3、HBase集群为IDEA运行的机器开通了白名单。

说明：

本实例用到的版本

软件名称	版本
Intellij IDEA	community 2018.3.1
操作系统：macOS/Windows	mac:10.13.6; Windows 10
jdk	1.8.0_25
scala	2.11.8
Maven	3.3.9

Idea 远程调试步骤

步骤 1：下载样例代码

使用git clone 命令下载代码样例代码。

git clone https://github.com/aliyun/aliyun-apsaradb-hbase-demo.git

步骤 2：导入代码到IDEA。

打开IDEA，选择"File">"Open..."，选择步骤 1下载的代码：aliyun-apsaradb-hbase-demo

步骤 3：设置运行配置

本实例Debug的类为：com.aliyun.spark.hbase.SparkOnHBaseSparkSession
点击IDEA运行按钮，选择"Edit Configurations..."进入配置页面，配置内容如下页面：

主要配置参数说明：

参数名称	值	说明
Main class	com.aliyun.spark.hbase.SparkOnHBaseSparkSession	运行主类
VM options	-Dspark.master=local	Spark 本地运行
Program arguments	hb-xxx:2181,hb-xxx:2181,hb-xx:2181 mytable spark_on_hbase	三个参数分别为：ZK链接地址（外网地址），hbase侧的表名，spark侧的表名
Use classpath of module	spark-examples	同时勾选“Include dependencie是with "Provided" scope”

步骤 4：开始Debug

在类com.aliyun.spark.hbase.SparkOnHBaseSparkSession的如下位置设置断点：

搜索类：org.apache.hadoop.hbase.spark.DefaultSource，并在如下位置设置断点：

然后右键类com.aliyun.spark.hbase.SparkOnHBaseSparkSession，选择“Debug SparkOnHBaseSparkSession”开始Debug。如下：

相关实践学习

lindorm多模间数据无缝流转

展现了Lindorm多模融合能力——用kafka API写入，无缝流转在各引擎内进行数据存储和计算的实验。

云数据库HBase版使用教程

  相关的阿里云产品：云数据库 HBase 版面向大数据领域的一站式NoSQL服务，100%兼容开源HBase并深度扩展，支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力，是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库，是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验：数据库上云实战开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引，您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。点击下方链接，领取免费ECS&RDS资源，30分钟完成数据库上云实战！https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl

Spark On HBase Idea远程调试

前提条件：

说明：

Idea 远程调试步骤

步骤 1：下载样例代码

步骤 2：导入代码到IDEA。

步骤 3：设置运行配置

步骤 4：开始Debug

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Spark On HBase Idea远程调试

前提条件：

说明：

Idea 远程调试步骤

步骤 1： 下载样例代码

步骤 2： 导入代码到IDEA。

步骤 3： 设置运行配置

步骤 4：开始Debug

热门文章

最新文章

相关课程

相关电子书

相关实验场景

步骤 1：下载样例代码

步骤 2：导入代码到IDEA。

步骤 3：设置运行配置