备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks中我们提交的spark程序中，中间结果show出来，但日志中没有，是咋回事？

DataWorks中我们提交的spark程序中，中间结果show出来，但日志中没有，是咋回事？

展开

收起

真的很搞笑 2023-06-04 17:33:32 228 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

游客mahexp74d6pzw

在DataWorks中，当您提交Spark作业时，您可以通过在Spark代码中使用collect()或show()函数来查看中间结果。这些函数将DataFrame转换为Scala Seq或Java ArrayList，并返回一个数组。这个数组可以手动打印或在UI中查看，但不会自动记录到日志中。

要在日志中查看中间结果，您需要在代码中添加一些额外的代码，以便将结果写入日志文件中。一种常见的方法是使用log()函数将结果打印到日志中。例如，您可以在代码中使用以下命令将结果写入名为"my_log.txt"的文件中：

scala import org.apache.spark.sql.SparkSession

val spark = SparkSession.builder.appName("MyApp").getOrCreate()

val df = Seq((1, "a"), (2, "b"), (3, "c")).toDF("id", "name")

df.show() // 显示中间结果

val logSession = spark.stop() // 将日志信息写入日志文件中

logSession.close() 这个例子演示了如何将日志信息写入日志文件中。在logSession.close()方法调用之前，所有日志信息都会被记录下来。这样，您就可以在DataWorks的日志文件中查看Spark程序的中间结果了。

2023-06-04 18:57:00

赞同展开评论
芯在这

spark任务实际应该是执行在集群上调度资源组是将作业下发到引擎所以一般看不到，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-06-04 17:44:50

赞同展开评论

问答分类：

分布式计算 DataWorks Spark 日志服务大数据开发治理平台 DataWorks

问答标签：

程序日志服务大数据开发治理平台 DataWorks程序日志 apache spark程序大数据开发治理平台 DataWorks程序大数据开发治理平台 DataWorks spark程序

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks 运行spark节点，程序logger日志无法展示

95

0

0

Dataworks 里的 ODPS spark 节点访问不到 maxcompute 里的表

133

1

0

DataWorks参照这文档最后为什么会看不到运行日志的tracking URL中查看运行结果？

142

1

0

DataWorks为什么这个提交失败呢？失败的日志哪里可以查看到？

110

1

0

DataWorks埋点日志的数据在数仓中怎么建模比较好，用datavault还是星型模型呢？

140

1

0

DataWorks怎么通过数仓HDW层的任务，调用执行某些java程序的api接口？有什么参考文档吗

134

1

0

DataWorks在java程序里，通过API的方式，调度HDW层的某些任务开始执行，有什么参考文档

135

1

0

dataworks可以开发spark streaming任务吗？

147

0

0

Seata中想通过nfs把日志输出到docker外面，会冲突，只能每个实例的日志文件不同名称对吗？

481

1

0

请问FC自带的SLS日志模块是否支持自定义字段？

1040

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

SLS 脱敏函数实践：构建 LLM 应用数据输出的安全防线

阿里云可观测 2025 年 10 月产品动态

SLS 物化视图来了：大规模日志查询提速 100 倍，资源消耗直降 90%

AI战略丨大模型应用元年，让智能真正转变为生产力

主流ChatBi产品推荐，一文看懂分析agent产品选型

热门讨论

热门文章

阿里云磁盘大小是多少？

数据来源：com.alibaba.fastjson.JSONException: syntax er

咱们这个API Path什么意思呢，是自定义的接口吗？还是统一规范的？

数据服务报429请求次数过多咋办呀

DataWorks中假如odps 有个string字段需要容纳的内容长度超过8M了，我想接进来？

添加资源后如何手动提交和发布？

问一下各位大佬，Dataworks如何能够定义参数获取月份不包含前面的0呢？例如6月份就是6而不是0

DataWorks表管理创建表报precision and scale is not current

DataWorks最近总报线程池满的提示，请问log要在哪里看啊？

DataWorks输入的时候提示有GROUP_CONCAT方法，运行的时候为什么报错呢？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

语雀+通义千问+DataWorks，让AI定期推送每周总结

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

DataWorks售前咨询

基于DataWorks搭建新零售数据中台

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

DataWorks Copilot：让你的数据质量覆盖率一键飞升！

欢迎加入DataWorks产品钉钉交流群

DataWorks百问百答69：有哪些数据集成报错（数据集成报错归类）？

展开全部

还有其他疑问?