开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

S3DistCp是什么?

S3DistCp是什么?

展开
收起
Lee_tianbai 2021-01-07 15:52:05 1478 0
1 条回答
写回答
取消 提交回答
  • S3DistCp 是 AWS 为 S3 上存储提供的 distcp 工具,S3DistCp 是 HadoopDistCp 的扩展,它进行了优化使得其可以和 S3 结合使用,并新增了一些实用功能。新增功能如 增量复制文件、复制文件时指定压缩方式、根据模式进行数据聚合、按照文件清单进行拷贝 等。

    2021-01-08 15:47:43
    赞同 展开评论 打赏

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载