文档备案控制台

开发者社区问答正文

问一个问题哈，在spark中默认使用java serialization ,但同时也提供了 kryo 序列化借口，今天测试了一下两个不同的序列号借口，发现并没有性能提升，我用的sparksql跑的测试，设计多个join操作，input量为270G , 这个为什么对性能没有提升呢？有大佬做过这方面的研究吗

问一个问题哈，在spark中默认使用java serialization ,但同时也提供了 kryo 序列化借口，今天测试了一下两个不同的序列号借口，发现并没有性能提升，我用的sparksql跑的测试，设计多个join操作，input量为270G , 这个为什么对性能没有提升呢？有大佬做过这方面的研究吗

展开

收起

社区小助手 2019-05-30 11:15:58 4350 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。

2.0开始，shuffle的时候已经默认为 kryo 序列化了

2019-07-17 23:36:21

赞同展开评论

问答分类：

分布式计算 Java Spark

问答标签：

Java性能 Java spark Java序列化测试性能 Java input

问答地址：

开发者社区 > 大数据 > 问答

相关问答

接入阿里云RSS后，小米Spark作业的稳定性和性能有哪些显著提升？

185

1

0

在TPCDS 10T数据集上，MRACC相比最新的Spark3.1版本性能提升了多少？

117

1

0

MRACC-Spark如何利用eRDMA近网络优化插件来提升性能？

133

1

0

MRACC相比社区版Spark在性能上有哪些提升？

101

1

0

内核技术中数据库/JAVA等高性能场景中的内存优化的技术方案是什么？

776

1

0

内核技术中数据库/JAVA等高性能场景中的收益是什么？

695

1

0

Storm&Spark中Spark的优异处理性能包括什么呢？

529

1

0

dubbo 支持的通信协议？有哪些序列化协议？说下 Hessian 的数据结构？【Java问答】48

958

1

0

Java消息中的ObjectMessage中定义的是可序列化还是不可序列化呢？

1552

1

0

如何使现有的Java多线程代码都可以获得异步的性能？

1396

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

Moltbot(Clawdbot)是什么？2026阿里云Moltbot/Clawdbot部署入口教程

阿里云Clawdbot是什么？2026年阿里云Clawdbot官网首页及后台登录入口链接在哪？

怎么购买阿里云服务器？2026年手把手教你省钱购买云服务器流程

2026年阿里云服务器有哪些配置可选？阿里云服务器配置大全参考

2026年4核8G阿里云服务器多少钱？收费标准、优惠活动价格与选购说明

相关文章

蓝易云：MyBatis的配置文件中定义类型别名(type aliases)的技巧。

快递物流推送-快递订阅API接口的运用

Java 做人工智能：从工具调用到系统重塑的终极方向

新书《鸿蒙HarmonyOS 6应用开发：从零基础到App上线》出版啦

Java大模型开发实践：框架赋能与核心落地要点

相关解决方案

更多

实现 MySQL 到 ADB 秒级分析性能

高效构建全球网络服务性能观测体系

通过 RDS 读写分离提升数据库性能

极致性能，搭建轻量 OLAP 分析平台

即享 QwQ-32B，性能比肩最强开源

还有其他疑问?