远端拉取数据的延迟和带宽无法随着计算资源线性扩展。硬件计算能力在不断发展,利 用 GPU 进行计算可以取得更快的训练速度。使用云上弹性计算 ECS、容器服务可以 快速调度起大规模的计算资源。访问对象存储需要走网络,得益于网络技术的发展,我们访问对象存储有一个高速网络,即便如此,对象存储的网络延时和带宽无法随着集群 规模线性扩展,可能会成为瓶颈,限制了训练速度。在计算存储分离架构下,如何高效 地访问到这些数据,成为了一个巨大的挑战。
需要更加便捷的通用的数据访问方式。深度学习框架如 TensorFlow 对于 GCS、 HDFS 支持较为友好,而对于诸多第三方对象存储的支持上较为滞后。而 POSIX 接口是 一种更自然友好的方式,使用类似于本地磁盘一样的方式访问数据,大大简化了开发者对存 储系统的适配工作。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。