指定列的Spark sql问题_问答-阿里云开发者社区

我们正在尝试将oracle db复制到hive中。我们从oracle获取查询并在hive中运行它们。所以，我们以这种格式得到它们：

INSERT INTO schema.table(col1,col2) VALUES ('val','val');
虽然此查询直接在Hive中工作，但当我使用spark.sql时，我收到以下错误：

org.apache.spark.sql.catalyst.parser.ParseException:
mismatched input 'emp_id' expecting {'(', 'SELECT', 'FROM', 'VALUES', 'TABLE', 'INSERT', 'MAP', 'REDUCE'}(line 1, pos 20)
== SQL ==
insert into ss.tab(emp_id,firstname,lastname) values ('1','demo','demo')
--------------------^^^

    at org.apache.spark.sql.catalyst.parser.ParseException.withCommand(ParseDriver.scala:217)
    at org.apache.spark.sql.catalyst.parser.AbstractSqlParser.parse(ParseDriver.scala:114)
    at org.apache.spark.sql.execution.SparkSqlParser.parse(SparkSqlParser.scala:48)
    at org.apache.spark.sql.catalyst.parser.AbstractSqlParser.parsePlan(ParseDriver.scala:68)
    at org.apache.spark.sql.SparkSession.sql(SparkSession.scala:623)
    at org.apache.spark.sql.SQLContext.sql(SQLContext.scala:691)
    at com.datastream.SparkReplicator.insertIntoHive(SparkReplicator.java:20)
    at com.datastream.App.main(App.java:67)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:755)
    at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:180)
    at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:205)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:119)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

0: jdbc:hive2://hpchdd2-zk-1.hpc.ford.com:218> select * from UDB.emp_details_table;
emp_id	emp_name	emp_dept	emp_joining_date
1	AAA	HR	2018-12-06
1	BBB	HR	2017-10-26
2	XXX	ADMIN	2018-10-22
2	YYY	ADMIN	2015-10-19
2	ZZZ	IT	2018-05-14
3	GGG	HR	2018-06-30

0: jdbc:hive2://hpchdd2-zk-1.hpc.ford.com:218> select * from UDB.emp_details_table;

emp_id

emp_name

emp_dept

emp_joining_date

AAA

2018-12-06

BBB

2017-10-26

XXX

ADMIN

2018-10-22

YYY

ADMIN

2015-10-19

ZZZ

2018-05-14

GGG

2018-06-30

emp_id	emp_name	emp_dept	emp_joining_date
1	AAA	HR	2018-12-06
1	BBB	HR	2017-10-26
2	XXX	ADMIN	2018-10-22
2	YYY	ADMIN	2015-10-19
2	ZZZ	IT	2018-05-14
3	GGG	HR	2018-06-30
6	VVV	IT	2018-12-18

emp_id

emp_name

emp_dept

emp_joining_date

AAA

2018-12-06

BBB

2017-10-26

XXX

ADMIN

2018-10-22

YYY

ADMIN

2015-10-19

ZZZ

2018-05-14

GGG

2018-06-30

VVV

2018-12-18

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

指定列的Spark sql问题

相关文章