阿里云创新手册-PolarDB开源生态专场-阿里云原生数据库PolarDB:数据业务永远在线,数据价值不断放大

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核8GB 50GB
简介: 阿里云创新手册-PolarDB开源生态专场-阿里云原生数据库PolarDB:数据业务永远在线,数据价值不断放大

作者:吴林,阿里云数据库高级产品专家


 

image.png 

 

阿里巴巴是亚洲最大的 Oracle 集群使用者有着超强的 DBA 团队。但是随着业务的发展,阿里巴巴需要适合业务的数据库进行支撑。于是2013 年,我们完成了 IOE 的历史使命,并在之后建立起了完善的异地多活体系。

 

随着云时代的到阿里巴巴于 2017 年推出了一系列数据库服务,用户遍及各行各业。如今,我们已经进入以PolarDB为代表的云原生数据库 2. 0 时代。

 

image.png 

PolarDB是阿里云数据库的品牌,包含云原生数据库 PolarDB 分布式数据库 PolarDB-XPolarDB采用共享存储、计算存储分离的架构,兼容MySQL、 PostgreSQL在语法上高度兼容 Oracle

 

PolarDB-X分布式数据库是 MySQL 生态,采用 share nothing 架构。

 

image.png

 

传统数据库部署简单,大多采用单节点的模式。随着技术的不断发展,PolarDB 采用了共享存储、计算存储分离的架构进行软硬件结合,使具备一主十五极致弹性的能力,提供高性能的数据库访问,同时支持海量存储,最高可达 100 TB。

 

PolarDB 具备高可用、高可靠、高性能等特点,不仅在互联网企业得到了广泛应用,在众多的民生领域得到了广泛应用。

 

PolarDB-X分布式数字库实践了另一条技术路线采用了 share nothing 架构,具备水平扩展能力,使其面向海量存储最大可支持 PB 级的数据存储。在超高并发的情况下,能够提供稳定的数据库服务。

 

image.png

 

PolarDB 支持 HTTP 混合负载,实现了事务处理与计算分析一体化同时 实现了计算内存存储的三层解耦

 

在共享存储层提供 3 副本,使得数据0丢失,支持行列存,并且行列存的事务保持一致。在处理过程中,实现了交易分析0时延。

 

在计算层提供节点内节点间的并行处理,在 TPC-C  TPC-H 的测试中全面优于同类产品。

 

image.png

PolarDB-X分布式数据库实现了集中式分布式的一体化,可以根据业务规模调整部署形态,可大可小同时实现了从单机到分布式的平滑升级。

 

image.png

 

PolarDB-X2021通过了北京国家金融科技认证中心的“金融分布式数据库标准验证的测试并于2022年发布了几个重要功能,包括支持大表数据的自动分区,实现了线性提升读写能力可灵活定义子分区,将热点数据进行打散,避免访问的热点影响效率。同时提供历史数据的自动归档,将冷数据存储在 OSS 上降低数据库的使用成本冷数据依然提供标准的SQL访问,其查询效率在线数据库保持一致。

 

同时,PolarDB-X 支持根据业务属性关联的表自动聚合,统一进行调度。消除了大部分的分布事务,使得分布式事务的性能得到了大幅提升。

 

image.png 

 

阿里云数据库在不仅在互联网行业得到了广泛应用,也覆盖了例如交通、电力、物流、金融等一系列关乎国计民生的重点行业助力政企数字化转型。阿里云自研的 PolarDB 数据库众多头部客户提供了支持,实现了企业国产化数据库的替代

 

同时,PolarDB 积极融入到信息技术创新赛道通过了国家信息安全测评,获得了自主原创产品的测评证书,也通过了金融分布式的数据库认证。我们积极地国内主流平台进行适配,比如鲲鹏、飞腾、海光支持阿里自研的倚天 710 芯片龙蜥操作系统与国内众多生态伙伴一起建立了长期合作关系,共同推动中国数据库的发展。

 

image.png

 

PolarDB 2021年进行了全面开源,致力于打造世界级的原生数据库的开源社区。今年的云栖大会发布了开源的 PolarDB-X 2. 2 版本,进一步提升了数据的强一致性,提升了性能,提供了企业级特性,比如存储分离节省数据的存储成本全面兼容了开源工具 

 

PolarDB for PostgreSQL开源了V11 版本提供了 HTTP 混合负载的能力以及安全的加密能力。同时,在开发者社区进行了持续投入举办了 PolarDB 开源大赛,参赛人员230,社区用户贡献者超21K。同时,与众多合作伙伴以及行业头部客户建立了全链路的生态合作关系,如韵达建立了联合实验室,深耕物流行业。

 

在人才培养方面积极投入线上PolarDB 的内容时长超过 100 小时,学习人数超过 150 万人次,获得相关证书学员超过 2000 人。

 

阿里巴巴将持续 PolarDB 进行开源,携手生态伙伴为用户创造更大的价值,推动开源数据库的协作人才的发展。



 


相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
打赏
0
0
0
0
367
分享
相关文章
PolarDB开源数据库进阶课18 通过pg_bulkload适配pfs实现批量导入提速
本文介绍了如何修改 `pg_bulkload` 工具以适配 PolarDB 的 PFS(Polar File System),从而加速批量导入数据。实验环境依赖于 Docker 容器中的 loop 设备模拟共享存储。通过对 `writer_direct.c` 文件的修改,替换了一些标准文件操作接口为 PFS 对应接口,实现了对 PolarDB 15 版本的支持。测试结果显示,使用 `pg_bulkload` 导入 1000 万条数据的速度是 COPY 命令的三倍多。此外,文章还提供了详细的步骤和代码示例,帮助读者理解和实践这一过程。
8 0
PolarDB开源数据库进阶课17 集成数据湖功能
本文介绍了如何在PolarDB数据库中接入pg_duckdb、pg_mooncake插件以支持数据湖功能, 可以读写对象存储的远程数据, 支持csv, parquet等格式, 支持delta等框架, 并显著提升OLAP性能。
10 0
PolarDB开源数据库进阶课16 接入PostGIS全功能及应用举例
本文介绍了如何在PolarDB数据库中接入PostGIS插件全功能,实现地理空间数据处理。此外,文章还提供了使用PostGIS生成泰森多边形(Voronoi diagram)的具体示例,帮助用户理解其应用场景及操作方法。
10 0
PolarDB开源数据库进阶课15 集成DeepSeek等大模型
本文介绍了如何在PolarDB数据库中接入私有化大模型服务,以实现多种应用场景。实验环境依赖于Docker容器中的loop设备模拟共享存储,具体搭建方法可参考相关系列文章。文中详细描述了部署ollama服务、编译并安装http和openai插件的过程,并通过示例展示了如何使用这些插件调用大模型API进行文本分析和情感分类等任务。此外,还探讨了如何设计表结构及触发器函数自动处理客户反馈数据,以及生成满足需求的SQL查询语句。最后对比了不同模型的回答效果,展示了deepseek-r1模型的优势。
14 0
PolarDB开源数据库进阶课14 纯享单机版
PolarDB不仅支持基于“共享存储+多计算节点”的集群版,还提供类似开源PostgreSQL的单机版。单机版部署简单,适合大多数应用场景,并可直接使用PostgreSQL生态插件。通过Docker容器、Git克隆代码、编译软件等步骤,即可完成PolarDB单机版的安装与配置。具体操作包括启动容器、进入容器、克隆代码、编译软件、初始化实例、配置参数及启动数据库。此外,还有多个相关教程和视频链接供参考,帮助用户更好地理解和使用PolarDB单机版。
11 0
PolarDB开源数据库进阶课12 集群版转换为单机版
本文介绍了如何将“共享存储实例”转换为“本地存储实例”,实验环境依赖于Docker容器中的loop设备模拟共享存储。具体步骤包括准备本地目录、停库、拷贝数据、修改配置文件并启动实例。通过这些操作,可以实现从共享存储到本地存储的平滑转换。相关系列文章详细记录了PolarDB RAC一写多读集群的搭建与管理,提供了丰富的实战经验。
11 2
PolarDB开源数据库进阶课1 搭建共享存储集群
在笔记本上构建PolarDB RAC环境,本文介绍了一种适用于Windows、macOS和Linux的方法:通过将宿主机上的文件模拟为块设备,并在多个Docker容器中使用loop设备共享该文件。此方法解决了macOS不支持直接挂载块设备的问题。
12 2
PolarDB开源数据库进阶课11 激活容灾(Standby)节点
本文介绍了如何激活PolarDB容灾(Standby)节点,实验环境依赖于Docker容器中用loop设备模拟共享存储。通过`pg_ctl promote`命令可以将Standby节点提升为主节点,使其能够接收读写请求。激活后,原Standby节点不能再成为PolarDB集群的Standby节点。建议删除对应的复制槽位以避免WAL文件堆积。相关操作和配置请参考系列文章及视频教程。
12 1
PolarDB开源数据库进阶课9 读写分离
本文介绍了如何配置读写分离工具pgpool-II for PolarDB,使应用程序能够透明地实现读写分离。
13 1
PolarDB开源数据库进阶课5 在线备份
本文介绍了如何在PolarDB RAC一写多读集群中进行在线备份,特别针对共享存储模式。通过使用`polar_basebackup`工具,可以将实例的本地数据和共享数据备份到本地盘中。实验环境依赖于Docker容器中用loop设备模拟的共享存储。
12 1

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等