《云计算加速开源创新》——打造世界级云原生数据库开源社区(下)

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核8GB 50GB
简介: 《云计算加速开源创新》——打造世界级云原生数据库开源社区(下)


更多精彩内容,欢迎观看:

《云计算加速开源创新》——打造世界级云原生数据库开源社区(上):

https://developer.aliyun.com/article/1223925?spm=a2c6h.13148508.setting.21.68ac4f0eE1VQvG


四、 开源数据库社区运营及生态建设

 1. 开源数据库社区运营策略

 

image.png

 

在社区生态运营上,我们主要做了以下两方面的工作。

 

第一个方面,我们希望打造一个技术驱动的社区。我们设计了一个技术驱动的社区组织架构,决策机构是技术委员会。技术委员会下面包括了一系列的专项兴趣组,通过专项兴趣组,探索数据库的应用场景,不断扩展数据库的应用边界。目前我们已经有11个专项兴趣组,包括自然语言处理、融合查询优化、异构软硬件适配等多个方向。

 

同时,面向开发者,我们会提供一系列的深度代码培训;面向用户,我们会邀请行业大咖,来分享开源数据库的使用经验和最佳实践,帮助开源数据库应用到更多的场景和行业。

 image.png

 

第二个部分是社区生态的建设。核心是伙伴和人才的培养。伙伴方面,我们主要关注数据库全栈伙伴的建设;同时,我们也会和重点行业的头部伙伴合作,成立联合实验室,打造行业专属的云原生数据库。同时,我们会大力投入到技术内容的建设上,目前我们已经打造了10余个技术内容栏目,涉及内核技术、应用开发、架构设计、认证培训等多个领域,学习人次已经超过150万+。

 

image.png

 

上图是未来我们希望看到的PolarDB开源生态构建图谱,它包括“南北东西”四个方向。

 

南向上,我们主要是和各类硬件和操作系统适配。

西向上,我们关注各类人才培养,包括运维、服务、研发、架构、分析等。

东向上,我们主要是和主流的工具、开源产品和平台适配,形成数据处理的完整能力。包括数据链路、数据运维、安全以及中间件。

北向上,我们主要关注和业务系统集成,服务好核心重点行业和有集成开发能力的合作伙伴。

 

2. 阿里云数据库和韵达的合作案例

 

接下来和大家分享一下韵达与阿里云数据库的合作。在此之前,先来看一段韵达集团副总裁兼CTO杨周龙发来的问候。

 

大家好,我是韵达集团副总裁兼CTO杨周龙,感谢云栖大会开源论坛的邀请,今年上半年韵达、阿里云宣布共建智慧物流数据库创新应用中心,共同探索、推进分布式数据库在智慧物流系统中的深度应用。在韵达日常运营中,每天都会产生数10亿条数据,且数据链还在快速增长。这对韵达核心业务系统数据库的稳定性、可用性、成本都提出了非常高的要求。

 

韵达联手阿里云共同推进,物流核心业务系统分布式数据库的打造升级,不但能解决生产运营中遇到的数据库存储、网络瓶颈等行业技术难题,还大大降低了数据库建设和维护成本,很好的满足公司业务未来高速发展的需要。

 

举个例子,韵达业务中台服务中有一个叫订单打标服务的共享服务,我们就采用了PolarDB-X代替了传统的分布分表。负责了韵达30+的前端业务系统,每天订单打标的量达到了2亿以上,接口查询量超过1亿次。

 

今年我们将经营新的技术架构,备战双十一业务高峰。我们坚信这个系统的承载力会比在外面有更好的表现,或许我们将进一步在韵达内部推广使用。

 

韵达具有丰富的行业应用场景,数据库又是智慧物流品牌的重要载体,安全的分布式数据库产品和技术之间,稳定性和灵活性值得被信赖,最后祝福云栖大会顺利举办,谢谢大家。

 

image.png

接下来继续分享阿里云数据库和韵达的合作案例。

 

2022年3月1日,我们与韵达成立了“智慧物流数据库创新应用中心”,共同探索云原生数据库在智慧物流核心系统中的深度应用。这也是阿里PolarDB-X全功能开源之后,在政企领域落地的首个公开大型案例。

 

我们一起做了两方面工作:一是对物流核心系统数据库进行云原生分布式改造;二是面向物流行业数据库使用特点的做内核能力的增强。

 

PolarDB-X为韵达提供了海量数据存储和超高并发能力,应对大规模业务量,帮助客户更好的向数智化过度。

 

image.png

 

这是我们和韵达一起改造的第一个项目:订单打标。它是韵达数据中台的一个关键应用模块,负责汇总平台方、订单中心、大客户等前端数据,并进行筛选、清理、打标,为下游服务平台进行支撑。该模块服务了包括韵图、智能外呼、用户画像等30多个中台业务。

 

早期采用传统MySQL分库分表方案实现,随着数据量的增加,这种传统的架构的弊端开始显现、稳定性差、扩展难度大,运维难度增加,根本无法满足业务快速迭代的业务需求。

 

因为PolarDB-X和MySQL高度兼容能力,我们帮助客户2周内就完成了整个应用的迁移。迁移之后,为韵达高并发的场景提供了很好的支持。同时,基于PolarDB-X有HTAP的能力,对一些复杂的SQL有支撑能力,为达标业务新增了数据统计、对账、结算等产品功能,大大提到了业务支撑能力;同时借助PolarDB-X的TTL能力,可自动完成历史数据清理,原来需要花费一周完成的历史数据清理的运维动作,现在由数据库自动完成,运维成本大大降低。

 

image.png

 

未来,我们希望有越来越多的核心系统,能够做云原生的改造升级,帮助客户实现产品升级、服务升级、业务升级。

 

3. 未来展望

 

image.png

 

当下,PolarDB已经得到了较为广泛的应用,特别是在高并发、大数据量、在线业务与复杂分析融合的极限场景,都有不错的表现。在这里我要对我们的用户和开发者表示感谢。未来也希望越来越多的人加入我们,共同来推动云原生数据库的技术发展。


相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
18天前
|
存储 容灾 关系型数据库
PolarDB开源数据库进阶课11 激活容灾(Standby)节点
本文介绍了如何激活PolarDB容灾(Standby)节点,实验环境依赖于Docker容器中用loop设备模拟共享存储。通过`pg_ctl promote`命令可以将Standby节点提升为主节点,使其能够接收读写请求。激活后,原Standby节点不能再成为PolarDB集群的Standby节点。建议删除对应的复制槽位以避免WAL文件堆积。相关操作和配置请参考系列文章及视频教程。
30 1
|
18天前
|
存储 NoSQL 关系型数据库
PolarDB开源数据库进阶课17 集成数据湖功能
本文介绍了如何在PolarDB数据库中接入pg_duckdb、pg_mooncake插件以支持数据湖功能, 可以读写对象存储的远程数据, 支持csv, parquet等格式, 支持delta等框架, 并显著提升OLAP性能。
32 0
|
18天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课15 集成DeepSeek等大模型
本文介绍了如何在PolarDB数据库中接入私有化大模型服务,以实现多种应用场景。实验环境依赖于Docker容器中的loop设备模拟共享存储,具体搭建方法可参考相关系列文章。文中详细描述了部署ollama服务、编译并安装http和openai插件的过程,并通过示例展示了如何使用这些插件调用大模型API进行文本分析和情感分类等任务。此外,还探讨了如何设计表结构及触发器函数自动处理客户反馈数据,以及生成满足需求的SQL查询语句。最后对比了不同模型的回答效果,展示了deepseek-r1模型的优势。
63 0
|
18天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课14 纯享单机版
PolarDB不仅支持基于“共享存储+多计算节点”的集群版,还提供类似开源PostgreSQL的单机版。单机版部署简单,适合大多数应用场景,并可直接使用PostgreSQL生态插件。通过Docker容器、Git克隆代码、编译软件等步骤,即可完成PolarDB单机版的安装与配置。具体操作包括启动容器、进入容器、克隆代码、编译软件、初始化实例、配置参数及启动数据库。此外,还有多个相关教程和视频链接供参考,帮助用户更好地理解和使用PolarDB单机版。
33 0
|
18天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课13 单机版转换为集群版
本文介绍如何将“本地存储实例”转换为“共享存储实例”,依赖于先前搭建的实验环境。主要步骤包括:准备PFS二进制文件、格式化共享盘为pfs文件系统、启动pfsd服务、停库并拷贝数据到pfs内、修改配置文件,最后启动实例。通过这些操作,成功实现了从本地存储到共享存储的转换,并验证了新实例的功能。相关系列文章和视频链接提供了更多背景信息和技术细节。
21 0
|
9天前
|
Kubernetes Cloud Native 开发者
alibaba-load-balancer-controller v1.2.0:开启云原生网关开源新篇章!敬请探索!
alibaba-load-balancer-controller v1.2.0:开启云原生网关开源新篇章!敬请探索!
91 61
|
10天前
|
关系型数据库 分布式数据库 数据库
喜报|PolarDB开源社区荣获“2024数据库国内活跃开源项目”奖
喜报|PolarDB开源社区荣获“2024数据库国内活跃开源项目”奖
|
18天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课12 集群版转换为单机版
本文介绍了如何将“共享存储实例”转换为“本地存储实例”,实验环境依赖于Docker容器中的loop设备模拟共享存储。具体步骤包括准备本地目录、停库、拷贝数据、修改配置文件并启动实例。通过这些操作,可以实现从共享存储到本地存储的平滑转换。相关系列文章详细记录了PolarDB RAC一写多读集群的搭建与管理,提供了丰富的实战经验。
20 2
|
18天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课18 通过pg_bulkload适配pfs实现批量导入提速
本文介绍了如何修改 `pg_bulkload` 工具以适配 PolarDB 的 PFS(Polar File System),从而加速批量导入数据。实验环境依赖于 Docker 容器中的 loop 设备模拟共享存储。通过对 `writer_direct.c` 文件的修改,替换了一些标准文件操作接口为 PFS 对应接口,实现了对 PolarDB 15 版本的支持。测试结果显示,使用 `pg_bulkload` 导入 1000 万条数据的速度是 COPY 命令的三倍多。此外,文章还提供了详细的步骤和代码示例,帮助读者理解和实践这一过程。
36 0
|
18天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课16 接入PostGIS全功能及应用举例
本文介绍了如何在PolarDB数据库中接入PostGIS插件全功能,实现地理空间数据处理。此外,文章还提供了使用PostGIS生成泰森多边形(Voronoi diagram)的具体示例,帮助用户理解其应用场景及操作方法。
38 0

热门文章

最新文章