在2017年的杭州云栖大会上,阿里云总裁胡晓明做了题为“智能计算,为未来而生”的主题演讲,在众多内容中,阿里云的自研数据库产品POLARDB,引发了广泛关注。
从上个世纪60年代诞生开始,数据库就永久的改变了人类对数据的管理和认知,陆续出现今日的DB2 、Oracle、Informix、MySQL等大玩家,现在,从登录淘宝购物到在社交网站上高谈阔论,背后都离不开数据库的支撑。
数据库,无处不在。
假如要详细的说清楚阿里云为什么要选择自研数据库这条路,大概可以从以下三个方面展开。
数据库已经处于不得不变革的时代
中国数据库第一次规模爆发是在电信行业,1995年,为了解决计费计量等问题,中国开启了第一次大规模的数据库建设。然而在中国数据库长达40多年历史中,自研数据库主要集中于政府,军工等国计民生领域,属于专用型的数据库,然而面对企业自用的高性能性通用型数据库,仍处于空白。
公元2017年9月21日,阿里云发布了全新一代云数据库产品POLARDB,这是首个国产的通用高性能自研数据库,在高性能通用数据库这块高地上,第一次有了中国面孔。此前这一块一直被国外厂商所独占。
历史开始着悄然变革,在海量数据膨胀的今天,金融、零售、物流等行业对于变革的渴望,间接对数据库技术提出了更高的要求。那在中国众多的互联网企业中,为何阿里云能够率先推出国产的通用高性能自研数据库?
时间回到2011年,以阿里巴巴为代表的互联网企业带动了中国各行各业开始“互联网+”,传统IT技术已经不能很好地满足“互联网+”之后的IT需求,例如:传统银行IT系统的设计基础是银行的网点数量、服务窗口数量,基于它就能计算一天银行总交易笔数是多少,因为来选择相应的IT基础设施,对这种稳定态的IT需求,传统的IT技术是最佳平台。
但在互联网时代,大促及活动,每一个互联网大型平台的波动,都会让交易量变得无法预测,以云计算为代表的互联网技术架构成为支持这种业务形态的最佳平台。
而更多的独角兽企业的涌现,再次挑战了传统的数据库架构。
再次回到传统数据库的最大应用场景:金融领域,最近余额宝的交易金额突破了万亿规模,成为了全球最大的货币基金,从2013年上线,业务在短短半个月增长了14倍,对底层技术架构带来了巨大的挑战,一方面每天晚上清算的时间从最初的半小时、变成后面的1小时、2小时、4小时……最后需要通宵达旦才能解决问题。
如果以传统IT的视角来看这样的扩容价格也是千万级别的,费用超过了天弘基金历年IT费用的总和。
如果把这个故事放到整个中国,未来中国企业将遭遇一场数据库的成本危机,在中国的互联网企业中,数据库成本在IT设施中占比已经高达20%~40%,更重要的是,“棱镜门”以后,越来越多的意识到,数据库的安全并非可以用高价进行购买,国家利益永远高于一切。
充分榨干硬件红利突破性能瓶颈
阿里云全新发布的云数据库产品POLARDB首次采用第三代分布式共享存储架构,通过高速网路连接数据库计算节点和存储节点,引擎特别为高速网络以及共享存储架构重新设计,使POLARDB实现了即时生效的可扩展能力和运维能力。
我们来看一组数据,100%兼容MySQL 5.6、100T级别容量无缝扩容、2分钟实现只读副本扩容、1分钟实现全量备份、性能提升6倍,读性能达到100万QPS,写性能达到13万TPS。
要说为什么POLARDB一定要实现这些性能顶点?阿里云数据库掌门人余峰说,今天阿里云做的是下一代数据库,出发点就是希望未来几年用户都触及不到这个天花板,留下时间让他们继续创新,不拿出点真本事,何谈引领一个时代。
POLARDB实现了节点间共享存储,让数据库可以实现真正的秒级水平扩展,以往这一操作往往需要2天甚至更长。软硬件一体化的优化,使POLARDB相对于传统数据库相同的更新操作减少了50%的磁盘写入量。并缩短了写数据的路径,写性能显著提高,读事务实现优化。
新的3DXpoint存储介质、NVMe SSD和RDMA网卡等最新的软硬件优化技术,通过自研的分布式共享存储引擎Polarstore,实现了低成本,高性能的突破。在标准场景下,POLARDB性能是MySQL的6倍,单实例最大存储容量实现100TB,而在云数据库厂商中,POLARDB性能超越了友商的“阿罗拉”1.2倍,实现了2倍于其单实例最大存储容量的超越,成为世界级的云数据库引导者。
云计算厂商必须要突破的技术壁垒
阿里巴巴,对于数据库的认知可谓异常深刻,早在淘宝初创时期,阿里巴巴就聚集了中国最顶尖的数据库团队,在那个远没有今天发达的时代,解决了一个个海量客户带来的问题,被国内数据库行业称为“黄埔军校”。
但要从根本上解决问题,则还是要回到数据库架构技术的突破上。
在经典的数据库架构中,一个是scale up,一个是scale out。
scale up的优点是能够迅速的通过硬件叠加的方法快速扩容,这是传统的商业数据库中经常采用的一种扩容手段。缺点则是随着容量的增大,成本将会成倍增长,对于许多初创企业来说,这样的成本很难接受。
scale out则是通过分布式技术来解决数据库容量的问题,这个思路来自于谷歌,优点是成本相较于scale up更低,然而缺点也显而易见,需要对整个应用的底层进行改写,对于许多复杂的系统来说,这无异于是一场灾难。
而POLARDB通过计算与存储分离的革命设计,既拥有分布式设计的低成本优势,又具有集中式的易用性,从底层解决了海量数据扩容的问题。同时,通过分布式存储技术,使数据库的成本远低于商用数据库。
正是有了这样低成本,高性能,高可靠性的数据库产品,未来中国才会诞生越来越多的爆发式独角兽,而无需担心高昂的数据库成本与扩容的问题,最大化地利用互联网的能力、IT基础设施上轻装上阵,全面云化,用更低的成本、获得了更好的IT处理能力,这才是未来企业的数字化答案。
就在不久之前,据媒体报道,众安保险将以750亿元的价格在香港上市,而很少有人知道的是,众安保险从诞生的第一天起,数据就在阿里云云数据库上。而在全国的各个城市,如火如荼的共享单车背后,云数据库支撑着oFo在三个月中从数万用户增长到千万量级。
而今天的云数据库市场,这样的故事正在不断发生。而在他们身后,阿里云用超过10万个数据库实例的实践经验,带来了POLARDB。