文档备案控制台

开发者社区大数据与机器学习开源大数据平台 E-MapReduce 正文

Spark访问OSS数据采用什么方式？

Spark访问OSS数据采用什么方式？

展开

收起

zxynnn 2022-05-10 12:09:52 1244 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客6lve7fjcitvo6

开源版Spark访问OSS数据默认采用Hadoop FileFormat接口直接对接OSSFileSystem实现。该方法在实践中发现存在性能差，一致性难以保证等问题。

2022-05-10 13:04:35

赞同展开评论

问答分类：

分布式计算对象存储 Spark 对象存储开源大数据平台 E-MapReduce

问答标签：

对象存储数据访问对象存储访问对象存储数据对象存储访问 spark对象存储

问答地址：

开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 问答

相关问答

大数据计算MaxCompute文档中有 spark 访问 OSS 部分。这个您知道是什么问题吗？

393

3

0

spark 写入oss-hdfs任务，spark客户端一直在等待，如何解决？

298

1

0

云数据仓库ADB Spark SQL访问OSS外表-（可选）步骤五：删除外表

223

1

0

Maxcompute spark访问oss对象存储是否可以走ENI方式

194

1

0

DMS任务编排跨库Spark SQL节点是否支持将数据导出到OSS单个文件

165

1

0

MaxComopute如何处理spark读ossWARN oss: [Client]Unabl...

170

1

0

MaxCompute spark访问oss外部表报错Odps external table i...

300

1

0

对象存储OSS的数据是如何组织的？

743

2

0

请问OSS的数据是如何组织的？

1682

9

0

【OSS】OSS的数据是如何组织的？

1200

1

0

大数据与机器学习

开源大数据平台 E-MapReduce

阿里云EMR是云原生开源大数据平台，为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎，计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

我要提问

相关文章

EMR + Flink 实战：从离线T+1到实时数仓的完整迁移路径

阿里云 OPC 一人公司套餐包含哪些云产品？云服务器、Token、Qoder及云存储等价格明细

阿里云 ES AI 引擎版：面向 Agent 场景，为亿级租户、千亿规模向量设计的搜索引擎

数字化转型落地：基于阿里云IoT构建企业全生命周期固定资产管理系统

基于YOLO11的电力施工绑扎不规范检测：从数据集准备到云上训练实践

相关解决方案

更多

多模态数据信息提取

高效存储和处理多媒体数据

应用日志数据归档

基于 Spark 和 PyTorch 的模型训练方案

多源数据下的企业 AI 助手实践

热门讨论

热门文章

企业定制软件开发全流程该怎么管控，才能不延期不超预算？

大数据开发场景里有一个比较典型需求:对数据表做分区。比如对日期字段做分区，但是在写入表之前的原始数据

非侵入式的CDC方案是什么？

StarRocks 能支持 AUTO_INCREMENT么

Tablestore利用 OSS 系统对接 Spark ，可以完成什么工作？

S3DistCp是什么？

在EMR Studio能帮忙开通下 notebook、workflow?

数据湖存储OSS是什么？

数据湖的对接主要体现在哪几个方面？

Spark访问OSS数据采用什么方式？

展开全部

JindoFS: 云上大数据的高性能数据湖存储方案

阿里封神-大数据处理技术漫谈

JindoFS概述：云原生的大数据计算存储分离方案

助力云上开源生态 - 阿里云开源大数据平台的发展

Flume NG 简介及配置实战

开源生态的新发展：Apache Spark 3.0、Koala和Delta Lake

使用Spark Streaming SQL基于时间窗口进行数据统计

通过可视化更好的了解你的Spark应用

E-MapReduce启动/停止HBase集群

E-MapReduce集群搭建HAWQ实践

展开全部

还有其他疑问?