文档备案控制台

开发者社区问答正文

spark foreach调用restful接口同步数据效率太差

通过编写 spark程序，读取数据库形成RDD，然后对RDD进行foreach操作，在内部实现方法中对遍历的元素通过调用restful接口同步第三方的数据到本地数据库，将程序提交到 spark集群后，1000条数据需要耗时 500秒才可以同步完，效率太差，加了spark.default.parallelism也没用，感觉是单线程一样，没有多线程并发执行。上千万数据需要同步，求问各位大神如何解决此问题，有什么好的方案吗？

展开

收起

louis.li 2018-05-06 19:15:45 4319 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

明朔

长期从事大数据系统与产品研发。

如果瓶颈在httpserver端，spark加并发解决不了，要具体问题具体分析。

2019-07-17 22:07:51

赞同展开评论

问答分类：

分布式计算数据库 Spark

问答标签：

Restful数据 apache spark数据 apache spark同步数据 Restful接口 apache spark同步

问答地址：

开发者社区 > 大数据 > 问答

相关问答

阿里云语音AI 语音识别 restful api接口 uniapp h5配置跨域报400，为什么？

345

1

0

RESTful API的数据操作与HTTP方法是如何对应的？

205

1

0

各位flink cdc 同步进hudi的数据，可以用spark 改吗？

187

1

0

阿里云语音AI这个在RESTful API接口中怎么调节这个参数？

219

3

0

如果开发一些restful接口或少量界面的功能，优先考虑哪个？有什么方法能像java那样打包部署么？

113

1

0

AUI 的 RESTful API 接口在哪里查看？

125

1

0

Flink CDC同步到hudi 可以直接读取hudi 的数据吗例如用hive 或者spark？

238

2

0

文字识别Ocr文档自学习这个有restful api在线接口吗？

216

4

0

在阿里语音AI我请求哪个接口以流的方式返回，或是restful是否支持流返回？

163

1

0

请教一下阿里语音AI长文本是没有go sdk吗？只有restful接口吗？

261

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

开阿里云服务器多少钱一个？带你了解不同类型的服务器价格

太糟糕了 Lingma

OpenClaw是什么？OpenClaw 新手怎么快速部署？一招教你搞定

通义灵码的 idea 插件，版本2.11.2，在idea 2026.1下，点击代码应用按钮报错

阿里云token多少钱？

相关文章

2026年制造业AI转型：三个最值得投入的方向

中小企业上云避坑：服务器续费涨价、数据迁移难，怎么提前规避风险？

alibabacloud-polardb-ai-assistant：让大模型成为你的数据库运维搭档

MySQL下载安装教程 | Windows安装MySQL 8.0详解（2026最新）

阿里云优惠券是什么？在哪领取？怎么使用？

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

还有其他疑问?