昨天,阿里云在北京举办了2018云数据库智能未来大会。
关于这场大会的文章我想了很久要怎么写,干货太多。
关于数据库,阿里云做了什么?
如果我不是从事互联网行业,可能会和很多人一样觉得数据库离我很遥远,“SQL”“NoSQL”“NewSQL”“分布式数据库”等等这一系列拗口的名词,能跟我扯上什么关系。不用我们去想,因为阿里云的工程师已经把我们和数据库联系在了一起。
阿里云云数据库高级产品专家 王义成
程序员善于把一切事物数据化,而数据库程序员善于把一切事物数据库化。他们认为解决人类生存吃饭的问题,需要EB级别的数据库,解决人类从碳基生命到硅基生命的问题,需要ZB级的数据库,而解决火星移民的问题,需要NB级的数据库。
EB级、ZB级、NB级没有概念?
那我们来看熟知的《冲顶大会》、《芝士超人》、《百万英雄》、《百万赢家》……这些直播答题,每天观看数达百万级,不断滚动的弹幕产生的数据是GB级的。
那往上延伸,一直到NB级的数据,我们到时候要怎么办?黑客帝国中,有一句经典的台词是,我只对一件事情感兴趣,未来。
所以,思考一下,我们在未来将如何面对NB级的数据。
王义成给出的答案是——基于量子比特的存储架构、量子编码技术和量子算法的量子数据库,它将能提供DB级的存储容量和高达100万倍的性能,数据库的终极形态,就是量子数据库 。
这是阿里人眼中数据库的未来,那现在呢?
企业如何承受住未来5年甚至更短时间内的数据量爆发式增长。
阿里云数据库技术总监蔡松露认为没有NewSQL:大规模增长的,灵活的企业数据无从谈起。
随着行业和技术在人工智能、IOT和5G网络等领域的发展,数据开始爆炸,对于数据的存储和读取不再能满足于传统的关系型和NoSQL数据库,而且数据库的分类边界都在逐渐消失,开始了新的融合,诞生为NewSQL。
阿里云NewSQL云数据库家族的诞生意味着以后用户从此不再需要关注底层数据库类型和技术。
从用户的角度出发,2009年开始阿里云数据库团队就不曾停歇。
从发布了MySQL数据库,解决用户对传统商用数据库的需求;到缓存数据库Memcache和持久型缓存数据库Redis,解决了用户大流量低延迟的需求;再到文档型数据库MongoDB,解决了用户海量数据灵活查询和存储的需求。
去年随着人工智能的爆发,发布了POLARDB、HBase解决了大规模数据存储和运算,同时发布了人工智能数据库诊断助手CloudDBA。
NewSQL家族实也现了如下提升:Redis4.0,自研版本性能提升3倍以上;MongoDB 3.4发布,自研引擎降低50%存储成本;HBase新产品存储成本仅为原来的1/10。
9年时间,阿里云云数据库懂得场景变化的真谛,也是阿里云云数据库的竞争核心。
9年后,再从用户出发,我们看到了数据库第一次有了“集装箱”的能力。在Redis 4.0中,其模块化的功能提供了搜索、时序、机器学习、文档处理等大数据分析模块,让同一份数据库的计算和分析成为可能。
阿里云云数据库技术总监 蔡松露
看到了FPGA在数据库领域的应用。蔡松露表示:“FPGA犹如一个公司有了中层领导,把以前直接需要CPU(总裁)计算的工作,在存储和网络部分通过FPGA(中层领导)就近完成计算,降低了CPU的负载,提升了整体的计算容量。”
关于数据,阿里云做了什么?
数据在未来,是最基本的生产资料,就像目前的煤炭和石油一样,每一个决策和生产都会围绕着数据,数据是不能丢的。
但是在2017年,数据丢失被勒索,成了企业最头疼的问题。
在WannaCry病毒大规模爆发时,前4天就造成了10亿美元经济损失;在Petya勒索病毒爆发后,给4家全球知名公司造成的经济损失远超10亿美元。
相关机构预测,勒索软件攻击带来的损失数字在未来将更加庞大,2019年的勒索软件攻击损失可能升至115亿美元。
我们不知道接下来还有多少个勒索软件出现,在此背景下,为了能保证用户数据不被窃取,阿里云数据库打造了完备的安全体系,从数据加密、漏洞检测和网络隔离层面做了全面的升级。
而这,在用户自建数据库中几乎不可能实现如此的安全等级。
除此之外,阿里云所有的数据库都有完备的高可靠度的容灾体系来应对未来的数据应用可能产生的灾难场景。
每一KB的数据,都在变得越来越宝贵,多可用区容灾,必将成为数据库的标配。
值得庆幸的是,阿里云Redis现已支持同城、异地容灾及异地双活的容灾模式,阿里云系统不仅自动帮助构建跨城的数据同步,承诺5s以内的数据延迟保证。并提供域名自动漂移、权限自动切换等一系列的容灾切换机制,保证数据库容灾系统的稳定性和可靠性,帮助客户的数据有备无患。
阿里云判断未来的数据库一定在云上,除了容灾和安全上的保障,在云上资源的调度能力将满足数据和计算资源的无限增长,同时保证业务的连续性,不断降低使用成本。
在保证性能提升的同时,云数据库MongoDB更通过技术手段,实现了成本的下降。
阿里云在全球云厂商中,率先支持了MongoDB的多存储引擎选购,在社区版WiredTiger的基础上,额外支持了擅长大数据量写入场景的RocksDB和能有效提高压缩率TerarkDB存储引擎。通过不同存储引擎的特性能提升实例规格使用效率,大幅降低硬件成本开销。
关于未来,阿里云做了什么
围观阿里云数据库做出的成绩,已经有了嚣张的资本。
然而阿里云不仅清晰的告诉我们今天的世界是什么样的,我们应该解决什么样的问题。还将精力放到了对未来的思考。
他们分析并得出诸如:
数据库应用进入“电力售卖”的商业模式,未来的数据库都在云上,按服务付费;
IoT,大数据,人工智能兴起,数据库场景面临前所未有的变化;
未来只需要一个在线的插件式的NewSQL数据库;
纯软件必死,软硬一体是未来NewSQL的必然方向等等等等一系列的结论。
想起一句话,我们要敢于思考“不可想像的事情”,因为如果事情变得不可想像,思考就停止,行动就变得无意识。
上述这些结论在以后真的会实现吗,我们现在不得而知。
但是我期待的是这样一些喜欢思考的阿里人聚在一起思考出的结论,未来将能带给我们怎样的惊喜。
拭目以待。