云时代下的开源之路 专访阿里云数据库团队

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介:

继开源跨平台开发框架Weex之后,阿里巴巴再次宣布另一个重大开源项目AliSQL。

云时代下的开源之路 专访阿里云数据库团队

在8月9日召开的2016云栖大会·北京峰会上,阿里云宣布启动AliSQL数据库开源项目。该版本性能优于社区版MySQL 70%左右,可帮助中小企业和开发者提升数据运营能力。阿里云方面表示欢迎大家共同参与开源项目,在使用的同时也贡献智慧,为数据库行业带来更多进步。

笔者有幸与阿里云数据库团队进行了一次面对面的对话,在这群活跃在当今几乎覆盖所有类型数据库领域的小伙子们身上,发现了我们正在苦苦找寻的东西:开放。

“阿里云在MySQL积累了至少8年以上,中间经历过像高并发、秒杀服务、数据安全等挑战。以前我们把这些能力放在云上,让人们能享受技术的红利,现在我们希望把它开源出去,回馈到社区,让技术能平民化快速发展,发挥更大的价值。”

阿里云关系数据库服务内核开发和运维团队负责人丁奇表示,将做了5年的MySQL数据库宣布开源需要勇气,阿里云希望将过去几年沉淀的技术积累回馈到社区,帮助更多使用MySQL的个人和企业,这是社区良性发展的道路。

经过多年历练,阿里云已经成为了中国云计算厂商中,对数据库引擎支持最多的一家,其云数据库支持的引擎超过了十个,覆盖了70%的关键在线数据库引擎。


以下是精彩问答

问:AliSQL有什么特点?

丁奇:AliSQL分支上的特点是安全性和高性能。在安全上,我们有数据加密存储方案。通过修改源码,堵住了通过MySQL提权获取本地文件系统权限的关键通道,在安全性上我们做了很多改进的工作。

高性能一直是AliSQL的标签。从阿里自身业务维护开始,积累的性能优化经验都体现在AliSQL上,我们在执行计划、io优化、压缩优化上做了大量工作。

新增的功能也是AliSQL的一大亮点。我们有内置的支持秒杀场景的方案、有限制导出数据时单线程性能消耗的语法、高效清空线程占用资源减少内存消耗等功能。这些都是在长期服务内外部客户时,从需求中抽象和实现的功能。

问:为什么要开源AliSQL?

丁奇:AliSQL是基于MySQL的,并从Percona,MariaDB,WebScaleSQL等社区汲取精华,我们希望将过去几年沉淀的技术积累回馈到社区,帮助更多使用MySQL的个人和企业,这是社区良性发展的道路。

由于官方提供的功能比较通用,支持了各种引擎,但有些引擎是不安全的,容易出事,我们要替用户多考虑一些,把不安全的引擎替换掉,虽然这些功能官方不会接受,但我们觉得非常重要。在我们开源的这部分里,会尽量把通用的推给MongDB,推给Oracle,同时把bug贡献给社区,用最快的速度解决问题。

问:2015年的双11,一天写进数据库的数据量就有10TB,今年将会做怎样的应对?

萧少聪(阿里云数据库产品专家,PostgreSQL中国社区主席):首先是buffer预留,这是传统的应对方案,还有高峰期的业务预估,还有对每个业务的健康度的打分,比如说双十一我们会把预案自动化。其实很多类似聚石塔这样的交易模型,在这几年的护航里面我们都是比较清楚了,如何增加机器监控与业务监控等我们早已烂熟于心。我们把它能够出现的异常都会事先给出自动化预案,提前布局,防范于未然。然后用打分机制去逐步的提高健康度,直到双十一之前我们不需要再去干预。

问:都说今年是大数据年,阿里云数据库在大数据方面会如何推进?

萧少聪:我们在整个ApsaraDB大的产品框架下,就正在推进这个方向。前期分析型数据库GreenPlum已经在公测,后面我们还有小数仓这样的项目,它的目是就是帮助用户用OLTP的形式导入数据库,在内部系统之间实现平滑流转并分析,我们叫它跨数据类型分析。

问:阿里云数据库运维功和安全功能很强大,对传统的DBA会不会造成冲击?

丁奇:今天开一个云上服务器,点一下按钮,五分钟内什么HA、数据备份都搭好了。其实,我们看到越来越多的传统行业包括金融,甚至制造业都在往云上靠,他们希望通过云的方式,解放DBA真正的价值。

以前我们把DBA分为运维DBA和业务DBA,其实现在也没有了,运维这层已经被云的功能替代掉了。现在阿里云内部的云数据库,有三百多个业务,只有一个DBA在管。

传统企业也希望他们的DB不是每天都在做备份、检查、复制、监控的工作。现在阿里的双十一都是自动化的,运维人员更轻松, DBA应该把时间空余出来,更好的去优化SQL,让企业运行得更好,去产生真正的业务上的价值。DBA这种职业是永远存在下去的,并不是被取代,只是原来可能很多是劳动型转向架构或者是脑力运行的形式。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
15天前
|
存储 SQL Apache
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
Apache Doris 是一个基于 MPP 架构的高性能实时分析数据库,以其极高的速度和易用性著称。它支持高并发点查询和复杂分析场景,适用于报表分析、即席查询、数据仓库和数据湖查询加速等。最新发布的 2.0.2 版本在性能、稳定性和多租户支持方面有显著提升。社区活跃,已广泛应用于电商、广告、用户行为分析等领域。
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
|
23天前
|
存储 关系型数据库 MySQL
MySQL vs. PostgreSQL:选择适合你的开源数据库
在众多开源数据库中,MySQL和PostgreSQL无疑是最受欢迎的两个。它们都有着强大的功能、广泛的社区支持和丰富的生态系统。然而,它们在设计理念、性能特点、功能特性等方面存在着显著的差异。本文将从这三个方面对MySQL和PostgreSQL进行比较,以帮助您选择更适合您需求的开源数据库。
89 4
|
1月前
|
缓存 弹性计算 NoSQL
新一期陪跑班开课啦!阿里云专家手把手带你体验高并发下利用云数据库缓存实现极速响应
新一期陪跑班开课啦!阿里云专家手把手带你体验高并发下利用云数据库缓存实现极速响应
|
1月前
|
存储 JSON Ubuntu
时序数据库 TDengine 支持集成开源的物联网平台 ThingsBoard
本文介绍了如何结合 Thingsboard 和 TDengine 实现设备管理和数据存储。Thingsboard 中的“设备配置”与 TDengine 中的超级表相对应,每个设备对应一个子表。通过创建设备配置和设备,实现数据的自动存储和管理。具体操作包括创建设备配置、添加设备、写入数据,并展示了车辆实时定位追踪和车队维护预警两个应用场景。
54 3
|
1月前
|
安全 NoSQL 关系型数据库
阿里云数据库:助力企业数字化转型的强大引擎
阿里云数据库:助力企业数字化转型的强大引擎
|
1月前
|
存储 NoSQL MongoDB
基于阿里云数据库MongoDB版,微财数科“又快又稳”服务超7000万客户
选择MongoDB主要基于其灵活的数据模型、高性能、高可用性、可扩展性、安全性和强大的分析能力。
|
1月前
|
存储 NoSQL MongoDB
小川科技携手阿里云数据库MongoDB:数据赋能企业构建年轻娱乐生态
基于MongoDB灵活模式的特性,小川实现了功能的快速迭代和上线,而数据库侧无需任何更改
|
SQL Cloud Native 关系型数据库
ADBPG(AnalyticDB for PostgreSQL)是阿里云提供的一种云原生的大数据分析型数据库
ADBPG(AnalyticDB for PostgreSQL)是阿里云提供的一种云原生的大数据分析型数据库
1258 1
|
数据可视化 关系型数据库 MySQL
将 PostgreSQL 迁移到 MySQL 数据库
将 PostgreSQL 迁移到 MySQL 数据库
1754 2
|
SQL 存储 自然语言处理
玩转阿里云RDS PostgreSQL数据库通过pg_jieba插件进行分词
在当今社交媒体的时代,人们通过各种平台分享自己的生活、观点和情感。然而,对于平台管理员和品牌经营者来说,了解用户的情感和意见变得至关重要。为了帮助他们更好地了解用户的情感倾向,我们可以使用PostgreSQL中的pg_jieba插件对这些发帖进行分词和情感分析,来构建一个社交媒体情感分析系统,系统将根据用户的发帖内容,自动判断其情感倾向是积极、消极还是中性,并将结果存储在数据库中。
玩转阿里云RDS PostgreSQL数据库通过pg_jieba插件进行分词