文档备案控制台

开发者社区问答正文

问一个问题哈，在spark中默认使用java serialization ,但同时也提供了 kryo 序列化借口，今天测试了一下两个不同的序列号借口，发现并没有性能提升，我用的sparksql跑的测试，设计多个join操作，input量为270G , 这个为什么对性能没有提升呢？有大佬做过这方面的研究吗

问一个问题哈，在spark中默认使用java serialization ,但同时也提供了 kryo 序列化借口，今天测试了一下两个不同的序列号借口，发现并没有性能提升，我用的sparksql跑的测试，设计多个join操作，input量为270G , 这个为什么对性能没有提升呢？有大佬做过这方面的研究吗

展开

收起

社区小助手 2019-05-30 11:15:58 4456 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。

2.0开始，shuffle的时候已经默认为 kryo 序列化了

2019-07-17 23:36:21

赞同展开评论

问答分类：

分布式计算 Java Spark

问答标签：

spark测试 spark Java 序列化java 序列化性能 spark序列化

问答地址：

开发者社区 > 大数据 > 问答

相关问答

云原生数据仓库AnalyticDB PostgreSQL是否测试过物化视图和行存表join下性能损失

240

2

0

根据JDK8的JMH测试数据，哪种快速构造字符串的方法性能最优，哪种略慢？

214

1

0

Databricks的TPC-DS测试中，DFP对查询性能的影响如何？

226

1

0

我在使用百炼产品文档的示例代码Java版进行测试时出现异常是什么原因？

218

1

0

mPaaS使用java端测试官网的dem报这个错是啥原因呢？

229

0

0

PolarDB有弹内的接入手册吗？想先创建日常的实例测试一下性能

220

1

0

WSBERT在哪些基准上进行了测试，并展示了怎样的性能提升？

167

1

0

ERes2Net在哪些公开测试集中取得了优异性能？

258

1

0

在benchmarking测试中，Lettuce多连接模式为何能展现最佳性能?

265

1

0

在benchmarking测试中使用了哪些工具来观察和分析性能?

208

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于credits购买机制

qoderWorkCn什么时候才能接入阿里云-百炼平台的token plan,自家套餐都没接入

程序员群体，大家都在用什么code plan方案？还有用的什么编码智能体？

QoderCN Jetbrains插件存在EDT反模式

你们能不能简化点购买什么的，一会qoder官网，一会进阿里云。想续费，点了一会来回跳。。。。

相关文章

【第二部分：大模型应用开发基础】6. Prompt Engineering 与 Context Engineering：生产级 Agent 如何管理上下文

大数据面试别只背八股！从零到拿下大厂的大数据系统设计备考路线

阿里云国际站（云老大）：别再让Java堆栈日志“断行”了！SLS Logtail多行合并与行首正则避坑指南

口碑好的陪玩管理系统公司有哪些开发，功能规划、架构设计与源码实现解析

相关解决方案

更多

深度研究：生成你的独家洞察报告

实现 MySQL 到 ADB 秒级分析性能

高效构建全球网络服务性能观测体系

极致性能，搭建轻量 OLAP 分析平台

基于 Spark 和 PyTorch 的模型训练方案

还有其他疑问?