开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

JindoFS弹性运维是什么?

JindoFS弹性运维是什么?

展开
收起
Lee_tianbai 2021-01-07 15:31:02 846 0
1 条回答
写回答
取消 提交回答
  • HDFS 使用 DataNode 在存储节点上来管理节点存储,全部数据块都存储在节点的 磁盘上,依靠 DataN ode 定期检查和心跳把存储状态上报给 Name Node, NameNode 通过汇总和计算,动态地保证文件的数据块达到设定的副本数(一般 3 副 本)。对于大规模集群(节点 1000+),经常需要进行集群节点扩容,节点迁移,节点下 线,节点数据平衡这样的操作,大量的数据块的副本计算增加了 NameNode 负载,同时, 节点相关操作要等待 NameNode 内部的副本调度完成才能进行,通常一个存储节点的下 线需要小时级别的等待才能完成。JindoFS 使用 StorageService 来管理节点上的存储, 由于 JindoFS 保证了数据在 OSS 上有一副本,所以本地的副本主要用来进行缓存加速。 对于节点迁移、节点下线等场景,JindoFS 无需复杂副本计算,通过快速的“标记”即可 完成下线。

    2021-01-07 15:31:11
    赞同 展开评论 打赏

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

相关电子书

更多
企业运维之云原生和Kubernetes 实战 立即下载
可视化架构运维实践 立即下载
2021云上架构与运维峰会演讲合集 立即下载