搭建的hadoop集群,需要切换到EMR,原有集群上的数据怎么传输上来呢?
对于数据小于1T的,可以通过公网或者专有网络拷贝的。用diskcp即可。
如果不想把emr的安全组对公网开放,可以先拷贝到OSS中,再diskcp oss hdfs拷贝过来。
对于数据大于1T的,建议采取 海量数据迁移至OSS服务:https://market.aliyun.com/products/52738004/cmfw000394.html?spm=5176.730005.203.95.wsQ43r
先把数据同步到OSS中,再diskcp oss hdfs拷贝过来。
如果是ecs上自己新建的hadoop集群,可以直接diskcp拷贝数据到hadoop集群的。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。