文档备案控制台

开发者社区问答正文

在部分分区数据丢失时，Spark可以通过什么来重新计算丢失的分区数据？

在部分分区数据丢失时，Spark可以通过什么来重新计算丢失的分区数据？

展开

收起

游客coqayqskxr2xe 2021-12-06 19:41:32 806 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客jegljo24q422m

在部分分区数据丢失时，Spark可以通过RDD的依赖关系重新计算丢失的分区数据，而不是对RDD的所有分区进行重新计算。

2021-12-06 19:42:07

赞同展开评论

问答分类：

分布式计算 Spark

问答标签：

apache spark计算 apache spark数据 apache spark分区 apache spark计算数据分区apache spark

问答地址：

开发者社区 > 大数据 > 问答

相关问答

使用maxcompute开发ODPS Spark任务，使用spark.sql 无法 rename分区

293

4

0

大数据计算MaxCompute的Maxcompute Spark 任务，开启动态资源调度，怎么报错？

279

3

0

大数据计算MaxCompute中maxcompute spark如何读取 oss 上面的文件？

614

3

0

Spark提供了哪些主要参数来调整计算存储资源的使用情况？

104

1

0

针对Lindorm数据源分区数量少导致Spark执行效率低的问题，有哪些处理策略？

90

1

0

调整Spark读取ODPS离线表分区大小的方法是什么？

144

1

0

在 Spark Structured Streaming 中，水印是如何计算和使用的？

222

1

0

请教一下，如何通过spark删除大数据计算MaxCompute分区数据啊？

224

3

0

Spark计算框架的官网地址是什么？

305

2

0

大数据计算MaxCompute怎么看到每个spark任务的具体花费，只能看到每种类型任务的总花费吗？

109

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

部署coclaw，报错如下，怎么办？应该点击哪里？

claude code接入千问3.5效果怎么样如题,用过的老哥给评测一下

灵码如何使用skills呢

copaw在魔搭平台搭建控制面板卡死重启无效

阿里云服务器镜像系统选哪个比较好？稳定和兼容性如何？

相关文章

关于阿里云 ODPS（MaxCompute）的全面介绍和应用

关于阿里云 ODPS（MaxCompute）的全面介绍和应用

MaxCompute SQL AI 实践

MaxCompute SQL AI实战：两个真实业务场景的高效落地

一行 SQL 搞定外卖平台评价智能分析 —— MaxCompute SQL AI 实战

相关解决方案

更多

基于数据闪回，快速恢复数据

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

高效存储和处理多媒体数据

还有其他疑问?