成本是也是用户上云的重要考量,JindoFS 的成本优势主要体现在运维成本和存储成 本两方面。运维成本指的是集群日常维护,节点上下线、迁移等。如前面分析,当 HDFS 集群增长到一定规模时,比如 10PB+,除了对 HDFS 进行专家级别调优外,还需要业务 上的拆分规划,避免达到 HDFS 元数据上的瓶颈。同时,随着集群数据不断增长,一些节 点和磁盘也会出现故障,需要进行节点下线和数据平衡,也给大集群的运维带来一定的复杂 度。JindoFS 可以使用 OSS + OTS 的存储模式,OSS 上保留原始文件和数据块备份, 对节点和磁盘出现的问题可以更好兼容;元数据(NamespaceService)采用 C++ 开发 加上工程打磨,相比 NameNode + JVM 在容量上和性能上也更有优势。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。