开发者社区> 问答> 正文

统一的元数据管理,可以实现什么?

统一的元数据管理,可以实现什么?

展开
收起
Puppet 2020-03-20 09:39:11 1126 0
1 条回答
写回答
取消 提交回答
  • 统一的元数据管理,可以实现: • 持久化的元数据存储。 之前元数据都是在集群内部的mysql数据库,元数据会随着集群的释放而丢失,特别是EMR提供了灵活按量模式,集群可以按需创建用完就释放。如果用户需要保留现有的元数据信息,必须登录集群手动将元数据信息导出。支持统一的元数据管理之后,不再存在该问题。 • 更方便地实现计算存储分离。 EMR上可以支持将数据存放在阿里云OSS中,在大数据量的情况下将数据存储在OSS上会大大降低使用的成本,EMR集群主要用来作为计算资源,在计算完成之后机器可以随时释放,数据在OSS上,同时也不用再考虑元数据迁移的问题。 • 更方便地实现数据共享。 使用统一的元数据库,如果用户的所有数据都存放在OSS之上,则不需要做任何元数据的迁移和重建,所有集群都是可以直接访问数据,这样每个EMR集群可以做不同的业务,但是可以很方便地实现数据的共享。

    2020-03-20 09:39:23
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
基于Spark的统一数据管理与数据探索平台 立即下载
INFINIDATA:基于Spark的统一数据管理与探索平台 立即下载
一站式在线数据管理平台DMS 立即下载