开发者社区> 问答> 正文

E-MapReduce如何使用Flume进行数据迁移

已解决

E-MapReduce如何使用Flume进行数据迁移

展开
收起
阿里云服务支持 2022-12-19 10:46:05 254 0
1 条回答
写回答
取消 提交回答
  • 官方回答

    需要在新集群上也开启flume服务,并且将数据按照和老集群完全一致的规则写入到新集群中。Flume分区表写入 Flume数据双写,双写时需控制开始的时机,要保证flume在开始一个新的时间分区的时候来进行新集群的同步。如flume每小时整点会同步所有的表,那就要整点之前,开启flume同步服务,这样flume在一个新的小时内写入的数据,在旧集群和新集群上是完全一致的。而不完整的旧数据在distcp的时候,全量的同步会覆盖它。而开启双写时间点后的新数据,在数据同步的时候不进行同步。 这个新的写入的数据,在划分数据阶段不要放到数据同步的目录里。 详情请参见:E-MapReduce数据迁移方案

    2022-12-19 10:58:47
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
作为全球云计算的领先者,阿里云为全球230万企业提供着云计算服务,服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务,给用户带来极速愉悦的服务体验。
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载