为什么使用 JindoDistCp?-问答-阿里云开发者社区-阿里云

开发者社区> Lee_tianbai> 正文

为什么使用 JindoDistCp?

来自:阿里云EMR 2021-01-07 15:54:05 263 1

为什么使用 JindoDistCp?

取消 提交回答
全部回答(1)
  • Lee_tianbai
    2021-01-08 15:47:19
    1. 效率高,在测试场景中最高可到 1.59 倍的加速,大大提高数据湖离线数据迁移效率。 2.
    2. 基本功能的选项丰富,提供多种拷贝方式和场景优化策略。 3.
    3. 深度结合 OSS,迁移后的文件直接以归档和低频、压缩等方式存放, 无需额外操作。 4.
    4. 实现 No-Rename 拷贝,保证数据一致性。 5.
    5. 场景全面,可完全替代 HadoopDistCp,支持多 Hadoop 版本。
    0 0
相关问答

3

回答

怎样进钉钉2个群

游客6bdmn27yntop2 2020-03-12 13:30:20 3448浏览量 回答数 3

2

回答

阿里云云原生数据库是什么,有什么作用?

Lee_tianbai 2021-01-07 15:15:47 810浏览量 回答数 2

1

回答

如果开传奇,同时在线4-5个版本需要什么配置云服务器多少带宽

木茶 2020-10-09 20:01:18 986浏览量 回答数 1

2

回答

什么是数据湖?

Lee_tianbai 2021-01-07 15:17:49 702浏览量 回答数 2

1

回答

数据湖要解决的三大问题是什么?

Lee_tianbai 2021-01-07 16:35:06 782浏览量 回答数 1

1

回答

阿里云DataWorks是如何解决元数据管理问题的?

Lee_tianbai 2021-01-07 16:36:21 1162浏览量 回答数 1

1

回答

阿里云DataWorks是如何解决数据集成问题的?

Lee_tianbai 2021-01-07 16:37:07 815浏览量 回答数 1

1

回答

阿里云DataWorks是如何解决数据开发问题的?

Lee_tianbai 2021-01-07 16:38:51 863浏览量 回答数 1

1

回答

为什么说数据湖是大数据和 AI 时代融合存储和计算的全新体系?

Lee_tianbai 2021-01-07 15:09:16 772浏览量 回答数 1

1

回答

常见的 CDC 方案实现之binlog 实时同步是什么?

Lee_tianbai 2021-01-07 16:25:07 709浏览量 回答数 1
+关注
0
文章
1008
问答
来源圈子
更多
E-MapReduce是构建于阿里云ECS弹性虚拟机之上,利用开源大数据生态系统,包括Hadoop和Spark,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。加入钉钉群聊阿里云E-MapReduce交流2群,点击进入查看详情 https://qr.dingtalk.com/action/joingroup?code=v1,k1,cNBcqHn4TvG0iHpN3cSc1B86D1831SGMdvGu7PW+sm4=&_dt_no_comment=1&origin=11
+ 订阅
推荐问答
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载