VLDB,全称International Conference on Very Large Databases,是数据库领域三大顶级国际会议之一,是由成立于美国的非盈利性机构VLDB基金会赞助和运营。第一届VLDB于1975年在美国召开,大会以在全球普及数据库技术研究和交流作为使命。
本届VLDB共有来自全球的750篇研究论文投稿,其中133被接收,接收率不到18%。整体内容覆盖traditional database、data analysis、spacial and graph和deap leaning等领域。在现场展示方面,VLDB2017的参展厂商既包括Oracle、SAP、Microsoft等传统含数据库业务的厂商,也包括阿里巴巴、Google和Facebook等新兴的互联网科技企业。
阿里巴巴数据库技术作为阿里IT基础设施的重要组成部分,和阿里云数据库ApsaraDB的技术支撑,在工程实践和技术创新上一直走在同行前列。从2011起,阿里数据库技术团队开始使用MySQL等开源数据库和OceanBase自研数据库取代传统商业数据库,2016年双11创下支付峰值12万笔/秒世界纪录;经过历年双11磨练,基于MySQL深度定制的AliSQL比官方版本性能提升70%,秒杀场景下性能提升近百倍。
业务能力方面,阿里巴巴已将自有数据库技术和服务通过阿里云输出,满足电商、云计算和金融等多种应用场景的客户需求,目前阿里云提供近20种数据库服务,是全球最稳定、最完整的云数据库产品阵列。
阿里自研的大数据计算服务——MaxCompute(原名ODPS),技术上支持高达EB级存储并提供完善的数据导入方案,支持包括SQL、MapReduce、Graph等计算类型及MPI迭代类算法在内的多种计算模式,具备万台服务器扩展能力和跨地域容灾能力,为阿里云上千万客户提供快速、完全托管的PB级数仓解决方案。该通用计算平台承担着阿里巴巴集团,蚂蚁金服,菜鸟网络,高德,优酷土豆等关联公司95%以上的大数据存储和计算任务。对外,在阿里云公共云和专有云上提供PaaS大数据开放服务,是阿里云-数加的主力计算平台。升级后的 MaxCompute2.0 完全拥抱大数据开源生态,支持更多的语言功能,带来更快的运行速度,为人工智能等热门领域提供海量数据计算支持。
即将发布的阿里云POLARDB,基于最新的存储和网络硬件设备特点,大量采用高速网络互联、存储块设备、分布式文件系统、数据库物理复制、数据共享存储等热点技术手段,通过放弃传统分布式数据库OLTP多路并发写的支持,采用一写多读的架构设计,简化分布式系统难以兼顾的理论模型,大幅度提升OLTP性能。
阿里自研实时高并发在线分析型数据库AnalyticDB,支持毫秒级的多个大表关联计算,全面兼容MySQL协议,内置支持多种数据源数据快速接入,支持高并发准实时数据写入/删除,写入速度可达数百万TPS,对千亿级数据进行即时的多维分析透视和业务探索。
在现场3天的交流展示环节中,众多工业界技术专家和高校学者到访阿里巴巴技术展台,就阿里目前在数据库和大数据方面的技术进展进行交流。来自Facebook的华人工程师陈国强回忆到,他曾在2012年初次来杭州做过交流,到VLDB2014在杭州举办,再到今天VLDB2017现场交流,让他感觉到阿里在大数据技术方面的能力和硅谷的差距正在迅速变小。
近年来,阿里巴巴数据库技术和学界合作也走在了前列,此次参与VLDB2017的数据技术领域知名学者,IEEE Fellow、新南威尔士大学林学民教授,已经在图数据库领域和阿里巴巴数据库技术团队一起展开合作。前微软研发合伙人周靖人也在去年加入阿里巴巴,周靖人是云计算大数据、大规模分布式系统和数据库等领域的国际级学者,他曾多次在数据和系统领域的国际顶会议上(VLDB、SIGMOD和ODSI等)发表论文,也是此次VLDB2017的工业和应用分论坛的主席之一。在此次展会期间,还有来自德雷斯顿理工的Wolfgang Lehner教授,滑铁卢大学的Tamer Ozsu教授等国际数据库学界顶级专家造访阿里技术展台并交流探讨。
从3月推出的NASA计划,到7月推出首个全球性科研项目“AIR”计划,阿里巴巴旨在解决社会经济发展中的“新技术”难题,驱动行业未来20年发展的科研项目,希望以此搭建学术界和工业界的合作平台,联合双方优势共同促进前沿技术的发展,推进计算机科学领域基础性、前瞻性、突破性的研究,构建全新基础技术生态。