Spark 本地连接OSS中对象存储 OSS是什么意思呢?
阿里云对象存储服务(Object Storage Service,简称 OSS),是阿里云提供的海量、安全、低成本、高可靠的云存储服务。 在使用Hadoop和Spark及其周边系统来处理和分析自己的数据时,则需要创建阿里云的E-MapReduce集群进行处理。
但是有时候,我们需要在本地环境下对程序进行调试,所以 本地的Spark环境能连接OSS对于开发者来说就显得尤为重要。
阿里云提供的文档更新比较久远,在使用教程时,会出现一些问题,所以本文提供一个可行的方法,让我们可以在本地环境读取OSS的数据,进行程序调试。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。