2017云栖大会·杭州峰会将于10月10日-14日在杭州云栖小镇隆重举行,据相关数据显示大会多场主题分论坛门票都已经售罄。在这110余场主题分论坛中,可能备受大家最为感兴趣是人工智能、大数据的专场。大数据的热度在深圳峰会、成都峰会、上海峰会都逐一印证。
提到阿里巴巴、阿里云大家都会想到大数据、科技,也会联想到阿里巴巴自研的大数据平台MaxCompute。MaxCompute从诞生至今也已经有7个年头了:从 2010 年 4 月,MaxCompute正式投入阿里云金融生产到2016 年 MaxCompute 2.0 云栖大会正式对外发布,无不证明MaxCompute在成长、在壮大、在拥抱生态、在赋能更多伙伴实现业务数据化,数据业务化。
(图:2016杭州云栖大会 计算平台负责人关涛做MaxCompute2.0发布)
距离2016年云栖大会已经整整一年,今年云栖大会·杭州峰会,MaxCompute会给大家带来什么不一样的主题分享呢?我们先看今年阿里云大数据计算服务(MaxCompute)专场的议题安排,在10月14日上午,具体如下:
MaxCompute 2.0从对外发布至今已经一年之余(MaxCompute在对外发布、上线都是需要在阿里巴巴集团内生产上锤炼并按期稳定运行2个月才能对外),那在这一年阿里巴巴的大数据技术都在哪些方面进化了,从架构上,从计算效率上,从存储成本上,从拥抱开源生态上、从对非结构化数据的支持上等,MaxCompute2.0一直在进化,从未停止过。这里有我们MaxCompute掌门人关涛对各位开发者做一个年度总结,总结MaxCompute 2.0在这一年是如何蜕变?
那提起阿里巴巴自主研发的大数据计算平台MaxCompute,更多人可能都喜欢将其与Hadoop、Spark、Flink等开源社区的产品做对比。Hadoop生态的繁荣是所有开发者都毋庸置疑的,但是并不代表其可以被所有开发者乃至创业公司、经过几轮融资的风口公司以及数据业务壮大的公司所能够有效掌控利用起来的。需要的运维团队、机房建设、网络建设等都是互联网风头上公司不可承受的时间成本和财务成本。而MaxCompute在公共云上对外提供服务,所有开发者只需要1分钟开箱即用,无需关心底层架构、运维等,同时MaxCompute在拥抱生态上也有了大幅度提升,用户可以无缝将任务迁移至MaxCompute,等等。这一块由MaxCompute生态研发主管李睿博为大家带来精彩分享。
MaxCompute在这一年来也做了很多优化,对阿里巴巴集团内以及对外部的客户都无形中释放了很多红利,比如MaxCompute 2.0在索引与优化上做了很多优化。随着业务的复杂性提升,MaxCompute遇到的问题千奇百怪,五花八门,匪夷所思。本Topic皆在解密MaxCompute2.0索引的原理以及如何优化慢查询的实践。
为此,MaxCompute 运营团队要邀请到众安保险数据总监王超群,为大家分享,众安保险是如何用MaxCompute为众安保险插上了大数据的翅膀。众安保险是一家数据驱动的创新型互联网保险公司,这家公司通过大数据的手段挖掘新的社会需求、创造新的产品,公司几乎所有的数据业务、算法模型都每天安全可靠的运行在MaxCompute上。MaxCompute是如何助力众安保险在云计算时代快速成长,为数据驱动的公司带来了哪些价值。
对于MaxCompute 有了一个全新的SQL 2.0引擎,无不实现高性能与低成本。这些在国际上都是有相关记录,在2015年Sort Benchmark在官方网站公布了2015年排序竞赛的最终成绩。其中,
阿里云用不到7分钟(377秒)就完成了100TB的数据排序,打破了Apache Spark的纪录23.4分钟。Sort Benchmark有全球科技公司“计算奥运会”之称,更早之前Hadoop的记录是72分钟。
2016 年 11 月 10 日,Sort Benchmark 在官方网站公布了 2016 年排序竞赛 CloudSort 项目的最终成绩。阿里云以$1.44/TB 的成绩获得 Indy(专用目的排序)和 Daytona(通用目的排序) 两个子项的世界冠军,打破了 AWS 在 2014 年保持的纪录 4.51$/TB。这意味着阿里云将世界顶级的计算能力,变成普惠科技的云产品。CloudSort 又被称为“云计算效率之争”,这项目赛比拼的是完成 100T 数据排序谁的花费更少,也是 Sortbenchmark 的各项比赛当中最具现实意义的项目之一。
那2017年,MaxCompute研发团队并没有闲着,他们到底在这一块标准测试中有哪些进展?本次也会由路璐技术专家为大家同步并介绍这一年来的测试进展。
从ODPS到MaxCompute,从MaxCompute到MaxCompute2.0,产品和技术上都得到很大提升,也很大服务将技术红利让给我们的用户,从计算、存储成本的节省,到开发效率的提升,再到生态开源的对接,MaxCompute一直在成长,那未来的路应该怎么顺应大数据时代潮流,如何满足不断变化的需求,林伟亲自为大家解读。
2017 杭州· 云栖大会 阿里云大数据计算服务(MaxCompute)专场不见不散!