云上Hadoop的优势
如果对E-Mapreduce有兴趣,可以访问E-Mapreduce培训系列之基本介绍 这里主要是围绕E-Mapreduce这款云产品展开的。
易用
主要体现在集群的创建、销毁、扩容、缩容等方面,目前一个集群基本4分钟内开启。支持作业的编排、作业执行错误后报警等。hadoop本身提供了基本的软件,目前hue、zeppelin、ooize等虽然提供了网页版本的交互式,任务的编排;但是毕竟不是企业的服务,也没有提供高可用的保证,对于报警,跟组内其它同事的账户也难以集成。emapreduce会提供这方面的服务,不过当前一些还在实现中。
低成本
主要体现在线下购买Hadoop、运维Hadoop集群的高成本。在云上有更好的组合方式,比如把数据放在OSS中,再启动emr集群按需运行。按照客户的业务情况,对于一直hold资源的场景,可以包年包月,如果业务增长,可以弹性增加资源。对于每天几个小时的ETL,可以按需运行,数据存放到OSS中。
深度整合
跟阿里云其它产品深度整合在一起,用户不仅仅只使用大数据系统,往往需要非常多的系统配合使用
可靠
平台提供运维工具,一方面如果一些可以自动修复的场景会自动修复,比如:datanode挂了重新拉起。一些比如master压力过大,则报警给客户,再上来查询。
安全
提供VPC的方式默认隔离其它用户,提供安全组可以设置访问的策略,RAM提供父子账号满足资源权限的隔离。
专业
提供专家系统分析客户执行作业的情况,比如好还是坏。专家服务可以提供大数据解决方案的咨询及解决客户的疑难杂症。
后记
这个是本系列的最后一篇,简单讲述了云上的一些优势。
其它云上Hadoop之X系列见: