文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

我根据操作maxcompute spark 在idea调试，不能正常执行，这个是什么情况呢？

"你好，我根据操作maxcompute spark 在idea调试，不能正常执行，这个是什么情况呢https://help.aliyun.com/document_detail/102430.html?spm=a2c4g.479449.0.0.8f70f54eMdaT6z 根据这个文档操作的，SparkPi可以，JavaSparkSQL这个类不行，好像出现格式问题，这种hive和odps哪里需要配置一下嘛？下载的时候是2.3，但是我的maxcompute 是2.4.5，我把它改成2.4.5了，我加了hive的校验策略之后变成这样了，是这里本地也要加一些参数嘛我修改了之后报上面新的错误，这个是这里需要做一些配置吗CupidConf，我看mc spark在idea执行分区表指定分区值插入会报错，在odps是正常的，这是正常现象吗，不存在分区值就是指定插入的分区值，显示指不存在，但是在odps执行是正确的，代码的话是官网文档下载的代码，https://help.aliyun.com/document_detail/149317.html?spm=a2c4g.148914.0.0.7c6d83adirwGut 这里下载的https://help.aliyun.com/document_de....7c6d83adirwGut，上传到odps可以 "

展开

收起

饭也太好吃了 2023-06-09 15:10:34 309 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小南瓜子
"这个参数去掉试一下，这样试一下？ 1.你自建一个file里边配置一下ak信息 odps.project.name= odps.access.id= odps.access.key= odps.end.point= 2. 代码里这样写 import org.apache.spark.sql.{SaveMode, SparkSession}

object SparkSQL_idea { def main(args: Array[String]): Unit = { // val spark = GetAllData.getSparkSession() val spark = SparkSession .builder() .appName(""SparkSQL"") .config(""spark.master"", ""local[2]"") .config(""spark.sql.catalogImplementation"", ""hive"") .config(""spark.sql.sources.default"", ""hive"") .config(""spark.sql.broadcastTimeout"", 20 * 60) .config(""spark.sql.crossJoin.enabled"", true) .config(""odps.exec.dynamic.partition.mode"", ""nonstrict"") .getOrCreate()
```
import spark._
import sqlContext.implicits._

val rdf = sql(""select * from bank_data limit 100"")
println(s""rdf count, ${rdf.count()}"")
rdf.printSchema()
```
}

}加一个本地的file文件写配置，把代码里的配置，写到一个文件里，这样，此回答整理自钉群“MaxCompute开发者社区2群(答疑@机器人)”"
2023-06-09 15:48:24

赞同展开评论

问答分类：

SQL 分布式计算 MaxCompute HIVE Spark 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute spark Idea调试 apache spark MaxCompute 云原生大数据计算服务 MaxCompute操作 Idea操作

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

通过idea访问MaxCompute如何控制智能访问某个表

141

1

0

MaxCompute如何处理控制台中操作角色权限报错没有权限

203

1

0

dataworks的同步支持提前在maxcompute上把对应的数据算出来，如果支持应该如何操作？

157

1

0

在大数据计算MaxCompute我的idea 没有上传资源注册函数功能，为什么？

221

0

0

在大数据计算MaxCompute这个权限我应该怎么操作给其它人赋予呢？

184

1

0

DataWorks这个白名单一直在变，我该怎么操作，我想把maxcompute的数据导入到rds？

199

2

0

MaxCompute事务表update操作报错Update statement not sup...

231

1

0

IntelliJ IDEA导入MaxCompute项目之后tables里面没有内容如何同步

167

1

0

DataWorks数据在oss，我在maxcompute中创建外部表这样操作数据源一直在oss对吧？

209

1

0

大数据计算MaxCompute的IDEA没法直接查看同步过来的表，总是报一个莫名的错误，怎么解决？

166

0

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

两天真实体验，Claude Code+ MiniMax-M3 比 CC+ DeepSeek编程强太多

月薪30K的测试开发都在偷偷用：这5个AI插件让你每天摸鱼5小时

阿里云账号：计算型/通用型/内存型价格与场景区别

EMR Serverless Daft 如何简化多模态数据处理：视频抽帧、清洗、标注全流程与具身智能实践

行为数据链路设计：从问题定位到策略回流

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

MaxCompute中下面图片是什么意思？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

datetime 类型是大数据计算MaxCompute特有的吗？

在大数据计算MaxCompute中，这种多久能查询到？

展开全部

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

阿里云MaxCompute 2019-5月刊

混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践

PyOdps DataFrame来临，数据分析从未如此简单！

标签分类理论

双11数据大屏直播 / 双11作战大屏

Mars——基于张量的统一分布式计算框架

展开全部

还有其他疑问?