pyspark streaming 实时数据保存到hbase 报错求高手指导?报错

from pyspark import SparkConf, SparkContext

spark = SparkContext(master = "local[2]",appName="StreamingWordCount")

aconf = {"hbase.zookeeper.quorum":"192.168.159.148","hbase.mapreduce.inputtable":"student",
"mapreduce.outputformat.class": "org.apache.hadoop.hbase.mapreduce.TableOutputFormat",
"mapreduce.job.output.key.class": "org.apache.hadoop.hbase.io.ImmutableBytesWritable",
"mapreduce.job.output.value.class": "org.apache.hadoop.io.Writable"}

keyConv = "org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter"

valueConv = "org.apache.spark.examples.pythonconverters.HBaseResultToStringConverter"
rawData = ['3,info,name,Rongcheng','4,info,name,Guanhua']
# ( rowkey , [ row key , column family , column name , value ] )
spark.parallelize(rawData).map(lambda x: (x[0],x.split(','))).saveAsNewAPIHadoopDataset(keyConverter=keyConv,valueConverter=valueConv,conf=aconf)

这个代码是一个单个rdd数据插入的只需要把实时的rdd接入就可以了现在我这个也是报空指针异常，我去取数据的时候有类似的方法能取到数据但是这个就报空，不启动hbase也是报空求指教是我的参数的问题么？

return_value
py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.saveAsHadoopDataset.
: java.lang.NullPointerException
   at org.apache.hadoop.hbase.security.UserProvider.instantiate(UserProvider.java:122)
   at org.apache.hadoop.hbase.client.ConnectionFactory.createConnection(ConnectionFactory.java:214)
   at org.apache.hadoop.hbase.client.ConnectionFactory.createConnection(ConnectionFactory.java:119)
   at org.apache.hadoop.hbase.mapreduce.TableOutputFormat.checkOutputSpecs(TableOutputFormat.java:177)
   at org.apache.spark.internal.io.SparkHadoopMapReduceWriter$.write(SparkHadoopMapReduceWriter.scala:76)
   at org.apache.spark.rdd.PairRDDFunctions$$anonfun$saveAsNewAPIHadoopDataset$1.apply$mcV$sp(PairRDDFunctions.scala:1085)
   at org.apache.spark.rdd.PairRDDFunctions$$anonfun$saveAsNewAPIHadoopDataset$1.apply(PairRDDFunctions.scala:1085)
   at org.apache.spark.rdd.PairRDDFunctions$$anonfun$saveAsNewAPIHadoopDataset$1.apply(PairRDDFunctions.scala:1085)
   at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)
   at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:112)
   at org.apache.spark.rdd.RDD.withScope(RDD.scala:362)

我的版本是spark2.2版本的 habse 1.4的 请问问题解决了吗 看 HBASE-20295 就知道怎么解决了

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

pyspark streaming 实时数据保存到hbase 报错 求高手指导?报错

相关文章

pyspark streaming 实时数据保存到hbase 报错求高手指导?报错