作者:吴林,阿里云数据库高级产品专家
阿里巴巴层是亚洲最大的 Oracle 集群使用者,有着超强的 DBA 团队。但是随着业务的发展,阿里巴巴需要更适合业务的数据库进行支撑。于是,2013 年,我们完成了去 IOE 的历史使命,并在之后建立起了完善的异地多活体系。
随着云时代的到来,阿里巴巴于 2017 年推出了一系列数据库服务,用户遍及各行各业。如今,我们已经进入以PolarDB为代表的云原生数据库 2. 0 时代。
PolarDB是阿里云数据库的品牌,包含云原生数据库 PolarDB 与分布式数据库 PolarDB-X。PolarDB采用共享存储、计算存储分离的架构,兼容MySQL、 PostgreSQL,在语法上高度兼容 Oracle 。
PolarDB-X分布式数据库是 MySQL 生态,采用 share nothing 架构。
传统数据库部署较简单,大多采用单节点的模式。随着技术的不断发展,PolarDB 采用了共享存储、计算存储分离的架构进行软硬件结合,使其具备一主十五读、极致弹性的能力,提供高性能的数据库访问,同时支持海量存储,最高可达 100 TB。
PolarDB 具备高可用、高可靠、高性能等特点,不仅在互联网企业得到了广泛应用,在众多的民生领域也得到了广泛应用。
PolarDB-X分布式数字库实践了另一条技术路线,采用了 share nothing 架构,具备水平扩展能力,使其面向海量存储最大可支持 PB 级的数据存储。在超高并发的情况下,能够提供稳定的数据库服务。
PolarDB 支持 HTTP 混合负载,实现了事务处理与计算分析一体化,同时 实现了计算、内存、存储的三层解耦。
在共享存储层提供 3 副本,使得数据0丢失,支持行存与列存,并且行存与列存的事务保持一致。在处理过程中,实现了交易与分析0时延。
在计算层提供节点内与节点间的并行处理,在 TPC-C 与 TPC-H 的测试中全面优于同类产品。
PolarDB-X分布式数据库实现了集中式与分布式的一体化,可以根据业务规模调整部署形态,可大可小,同时实现了从单机到分布式的平滑升级。
PolarDB-X于2021年通过了北京国家金融科技认证中心的“金融分布式数据库标准验证”的测试,并于2022年发布了几个重要功能,包括支持大表数据的自动分区,实现了线性提升读写能力,可灵活定义子分区,将热点数据进行打散,避免访问的热点影响效率。同时提供历史数据的自动归档,将冷数据存储在 OSS 上降低数据库的使用成本,且冷数据依然提供标准的SQL访问,其查询效率与在线数据库保持一致。
同时,PolarDB-X 支持将根据业务属性关联的表自动聚合,统一进行调度。消除了大部分的分布事务,使得分布式事务的性能得到了大幅提升。
阿里云数据库在不仅在互联网行业得到了广泛应用,也覆盖了例如交通、电力、物流、金融等一系列关乎国计民生的重点行业,助力政企数字化转型。阿里云自研的 PolarDB 数据库为众多头部客户提供了支持,实现了企业国产化数据库的替代。
同时,PolarDB 积极融入到信息技术创新赛道,通过了国家信息安全测评,获得了自主原创产品的测评证书,也通过了金融分布式的数据库认证。我们积极地与国内主流平台进行适配,比如鲲鹏、飞腾、海光,支持阿里自研的倚天 710 芯片与龙蜥操作系统,与国内众多生态伙伴一起建立了长期合作关系,共同推动中国数据库的发展。
PolarDB 于2021年进行了全面开源,致力于打造世界级的云原生数据库的开源社区。今年的云栖大会发布了开源的 PolarDB-X 2. 2 版本,进一步提升了数据的强一致性,提升了性能,提供了企业级特性,比如存储分离节省数据的存储成本,并全面兼容了开源工具。
PolarDB for PostgreSQL开源了V11 版本,提供了 HTTP 混合负载的能力以及安全的加密能力等。同时,在开发者社区进行了持续投入,举办了 PolarDB 开源大赛,参赛人员230人,社区用户与贡献者超21K。同时,与众多合作伙伴以及行业头部客户建立了全链路的生态合作关系,如与韵达建立了联合实验室,深耕物流行业。
在人才培养方面积极投入,线上PolarDB 的内容时长超过 100 小时,学习人数超过 150 万人次,获得相关证书学员超过 2000 人。
阿里巴巴将持续对 PolarDB 进行开源,携手生态伙伴为用户创造更大的价值,推动开源数据库的协作与人才的发展。