1、兼容性
emr是完全兼容开源的接口的,比如:hive、hbase、impala、presto等。
2、易用性
提供的spark等引擎,提供非常灵活的编程,自定义算法,可以通过引导操作安装所需的软件,依赖库,可以访问公网、可以访问客户自己的ecs上的网站。
3、性能及成本
此点不好说。在emr中,由于保证了cpu、内存、网络、磁盘等,往往不同时刻运行作业的时间差不多。 成本方面emr提供按需运行,数据放在低成本的oss中,这是最低的成本开销。 计算引擎 非常丰富,可以按照不同的场景按优选择引擎。
MaxCompute 是阿里自主研发的一款大数据产品,在使用场景上和 E-mapreduce 上差别不是太大。目前比较官方的口径上说两者的差别目前暂时还没有。MaxCompute 是阿里开发的,对外不开源,但是封装后使用起来比较方便,而且运维成本也较低。E-mr 是基于开源的 hadoop 体系做的产品 。如果您的开发人员有比较多的 Hadoop 经验的话,可以直接使用。而用 MaxCompute 的话,需要对代码做一些修改,虽然修改量并不大 。MaxCompute 是阿里自主研发的一款大数据产品,在使用场景上和 E-mapreduce 上差别不是太大 。
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。
大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。