阿里云 MaxCompute :轻松玩转大数据
摘要:今天为大家介绍的是 MaxCompute ,它是一种全新的大数据计算服务,能够提供快速且完全托管的PB级数据仓库解决方案。
借助 MaxCompute ,企业无需耗费巨额资金建设数据中心,即可对高达PB级的海量数据进行分析处理。 MaxCompute 拥有独创的底层存储技术,采用高效的压缩存储格式,具备超强的五倍压缩能力,极大地提高了数据压缩比,有效提升了磁盘 IO 性能,同时显著节省了用户成本。
在计算能力方面, MaxCompute 的表现尤为出色。2015年10月的 Sort Benchmark 排序竞赛中, MaxCompute 仅用时377秒便完成了100 TB 的数据排序,一举打破了四项世界纪录。与 Hadoop 等开源软件不同, MaxCompute 是一种全新的分布式数据存储计算引擎,其所有功能以“all in one box”的方式提供服务。
用户不仅可以在 MaxCompute 上进行基本的数据导入、导出、SQL 查询以及ETL处理,还能够运用机器学习算法进行建模,开展高级数据分析。其丰富的用户接口,可轻松与 ECS、RDS 分析型数据库以及其他BI报表工具等配合使用,以完成BI分析工作。更为值得一提的是,从商业智能分析、广告个性化推荐,到基因测序以及好莱坞级别电影动画渲染等领域, MaxCompute 都能够提供有力支持。
MaxCompute 不仅在计算性能上表现卓越,在服务方面也极具专业性。其专业性首先体现在兼容开放上, MaxCompute 融合了多种计算模型,支持 SQL、MapReduce、Graph 以及 MPI 迭代类算法,并且与开源的大数据处理软件编程接口高度兼容。这意味着用户无需为修改程序而烦恼,所有应用均可轻松迁移至 MaxCompute 平台。 其专业性还体现在开箱即用的便捷性上。使用 Hadoop 等开源软件时,用户需要手工配置和升级集群,针对不同组件还需解决版本兼容问题,运维工作既繁琐又耗费精力。
而 MaxCompute 则解决了这些难题,它具备集成化的操作界面,用户无需关注机群的搭建、配置和运维工作,仅需通过简单的鼠标点击操作,即可在 MaxCompute 中上传数据、进行分析并获取结果。 此外, MaxCompute 的专业性还体现在安全可靠方面。它是国内首家通过 CSA STAR 和 ISO27001两项国际云安全认证的产品,在各个环节均采用国际上最先进的数据安全管理标准,拥有完善的认证和健全的解决方案,真正实现了数据的自主可控,让用户体验到金融级的可靠性。其多租户机制确保了用户数据的隔离,同时采用三重备份、读写请求鉴权、应用沙箱、系统沙箱等多层次的数据存储和访问安全机制,充分保障用户数据的安全。
灵活的数据授权功能,使得组织中的多名数据分析师能够协同工作,且每人仅能访问自己权限许可范围内的数据,在保障数据安全的前提下,最大程度地提高了工作效率。 在计算性能强大、服务专业的同时, MaxCompute 的价格也极具竞争力。使用开源的 Hadoop、Spark 等软件,企业需要拥有专业的运维团队和维护人员,而招聘开源人才难度较大,人力成本投入较高。而 MaxCompute 的出现,让企业无需再为 Hadoop 人才的稀缺而担忧,帮助企业节省了一个运维团队的成本。
此外, MaxCompute 采用按量付费的模式,成本更低。凭借其更高效的计算及存储能力, MaxCompute 能够降低企业20%至30%的采购成本,同时性能却能提升2.5倍。 自2010年起, MaxCompute 便支撑起阿里巴巴集团所有的大数据分析挖掘业务。经过长时间在数据业务场景中的实践锤炼, MaxCompute 帮助用户解决了无数难题,真正实现了大数据计算的产品化。例如,墨迹天气借助 MaxCompute ,在数据分析和运维成本上节省了70%的开支;华大基因通过 MaxCompute ,将每千人基因的测序时间从几个月缩短至一天。 如果您也期望开启高效的大数据之旅,那就赶快加入使用 MaxCompute 吧!