开源PolarDB-X部署体验:挑战与反思

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
简介: 本文记录了部署开源PolarDB-X的体验及挑战。PolarDB-X是一款云原生分布式SQL数据库,具备高性能和可扩展性。部署中遇到的问题包括依赖冲突、文档不清晰及官方文档无法访问等。建议改进文档准确性、增强错误提示和支持、简化部署流程,如采用Docker简化快速入门。尽管部署未成功,但仍对PolarDB-X未来发展持乐观态度。

本文记录了我在尝试部署开源PolarDB-X过程中的体验,包括遇到的挑战、解决方案尝试以及对产品改进的建议。

1. 引言
作为阿里云数据库产品技术的重要组成部分,PolarDB-X以其高性能和可扩展性在数据库领域备受瞩目。尽管我未能成功完成部署,但这次体验让我对PolarDB-X有了更深入的了解,并对其未来的发展充满期待。

2. 产品介绍
PolarDB-X 是一款云原生分布式 SQL 数据库,专为高并发、海量存储和复杂查询场景而设计。它采用无共享架构,计算与存储分离。它支持水平扩展、分布式事务和混合事务和分析处理 (HTAP) 工作负载,具有企业级、云原生、高可用性、与 MySQL 及其生态系统高度兼容的特点。

PolarDB-X最初是为了解决阿里巴巴天猫“双十一”核心交易系统数据库的扩展性瓶颈而诞生的,并伴随阿里云一路成长,是经过众多客户核心业务系统验证的成熟稳定的数据库系统。

PolarDB-X的核心特性包括:

  • 水平可扩展性:PolarDB-X采用Shared-nothing架构设计,支持多种Hash、Range数据分片算法,并通过隐式主键分片和数据分片动态调度实现透明的水平扩展。

  • 分布式事务:PolarDB-X采用MVCC+TSO方式,通过2PC协议实现分布式事务,事务满足ACID特性,支持RC/RR隔离级别,并通过单阶段提交、只读事务、异步提交等优化实现高性能。

  • 高温热解法:PolarDB-X通过原生的MPP能力支持分析型查询,并通过CPU配额约束、内存池化、存储资源分离等方式实现OLTP与OLAP流量的强隔离。

  • 企业级:PolarDB-X具有许多针对企业场景设计的能力,例如SQL并发控制、SQL Advisor、TDE、三重权限分离、闪回查询等。

  • 云原生:PolarDB-X在阿里云拥有多年的云原生实践,支持通过K8S Operator管理集群资源,支持公有云、混合云、私有云等形态部署。

  • 高可用性:PolarDB-X通过Multi-Paxos协议实现数据强一致性,支持跨数据中心部署,并通过Table Group、Geo-locality等提高系统可用性。

  • 兼容 MySQL 及其生态系统:PolarDB-X的目标是全面兼容MySQL,目前包括MySQL协议,大部分MySQL SQL语法,Collat​​ions,事务隔离级别,二进制日志等。

3. 环境准备
准备了两台主机,使用pxd安装:
Centos7:
OS版本:7.9.2009
python版本:Python 3.6.8
pip版本:pip 21.3.1
docker版本:Docker version 26.1.4

*Ubuntu:*
OS版本:22.04
python版本:Python 3.10.12
pip版本:pip 24.2
docker版本:Docker version 24.0.7

4. 安装过程
打开官网的帮助文档(https://openpolardb.com/document?type=PolarDB-X),但很不巧页面打不开. 好在开源了在github上还有文档: https://github.com/polardb/polardbx-sql
image.png
根据快速入门的要求,安装了python和docker,但在都在安装pxd的时候遇到了问题:

执行 pip3 install pxd 时报错:

Centos7报错:
image.png

ubuntu22.04报错:
image.png

相关的报错在github的Issues中有类似报错,但没有找到解决办法!

5. 遇到的挑战与解决方案
在部署过程中,我遇到了以下问题:

  • 依赖问题:某些依赖软件版本不兼容,导致安装失败。
  • 官方文档不打开:不知是因为我本地网络问题还是什么原因,官方网站上的文档尝试多个时段一直打不开,只好去github上查看文档。
  • 文档不准确:文档中有部分错误或不明确,如ubuntu有多个在用的发行版,文档中的apt-get install python3.8 python3.8-venv 在22.04中不适用。centos7下安装pxd时的命令应该为 pip3 install pxd 等 。

尽管我尝试了多种解决方案,包括更新版本、调整配置参数等,但最终仍未能成功部署PolarDB-X。

6. 改进建议
基于我的体验,我提出以下改进建议:

  • 文档优化:帮助文档应更详细地说明依赖软件的版本要求。
  • 错误处理:增加错误处理机制,提供更清晰的错误信息和解决方案。
  • 社区支持:加强社区交流,提供更快速的技术支持和问题解答。
  • 更简单的快速入门:因为在主机上部署依赖pxd工具,而python的依赖不太好处理。如果可行建议全部使用docker和docker compose 来进行快速入门的部署

7. 结论
尽管我在部署PolarDB-X的过程中遇到了挑战,但这次体验让我对PolarDB-X的潜力有了更深的认识。我相信通过不断的优化和改进,PolarDB-X将在未来发挥更大的作用。

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
相关文章
|
13天前
|
存储 容灾 关系型数据库
PolarDB开源数据库进阶课11 激活容灾(Standby)节点
本文介绍了如何激活PolarDB容灾(Standby)节点,实验环境依赖于Docker容器中用loop设备模拟共享存储。通过`pg_ctl promote`命令可以将Standby节点提升为主节点,使其能够接收读写请求。激活后,原Standby节点不能再成为PolarDB集群的Standby节点。建议删除对应的复制槽位以避免WAL文件堆积。相关操作和配置请参考系列文章及视频教程。
20 1
|
13天前
|
存储 NoSQL 关系型数据库
PolarDB开源数据库进阶课17 集成数据湖功能
本文介绍了如何在PolarDB数据库中接入pg_duckdb、pg_mooncake插件以支持数据湖功能, 可以读写对象存储的远程数据, 支持csv, parquet等格式, 支持delta等框架, 并显著提升OLAP性能。
27 0
|
13天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课15 集成DeepSeek等大模型
本文介绍了如何在PolarDB数据库中接入私有化大模型服务,以实现多种应用场景。实验环境依赖于Docker容器中的loop设备模拟共享存储,具体搭建方法可参考相关系列文章。文中详细描述了部署ollama服务、编译并安装http和openai插件的过程,并通过示例展示了如何使用这些插件调用大模型API进行文本分析和情感分类等任务。此外,还探讨了如何设计表结构及触发器函数自动处理客户反馈数据,以及生成满足需求的SQL查询语句。最后对比了不同模型的回答效果,展示了deepseek-r1模型的优势。
46 0
|
13天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课14 纯享单机版
PolarDB不仅支持基于“共享存储+多计算节点”的集群版,还提供类似开源PostgreSQL的单机版。单机版部署简单,适合大多数应用场景,并可直接使用PostgreSQL生态插件。通过Docker容器、Git克隆代码、编译软件等步骤,即可完成PolarDB单机版的安装与配置。具体操作包括启动容器、进入容器、克隆代码、编译软件、初始化实例、配置参数及启动数据库。此外,还有多个相关教程和视频链接供参考,帮助用户更好地理解和使用PolarDB单机版。
26 0
|
13天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课13 单机版转换为集群版
本文介绍如何将“本地存储实例”转换为“共享存储实例”,依赖于先前搭建的实验环境。主要步骤包括:准备PFS二进制文件、格式化共享盘为pfs文件系统、启动pfsd服务、停库并拷贝数据到pfs内、修改配置文件,最后启动实例。通过这些操作,成功实现了从本地存储到共享存储的转换,并验证了新实例的功能。相关系列文章和视频链接提供了更多背景信息和技术细节。
17 0
|
6天前
|
关系型数据库 分布式数据库 数据库
喜报|PolarDB开源社区荣获“2024数据库国内活跃开源项目”奖
喜报|PolarDB开源社区荣获“2024数据库国内活跃开源项目”奖
|
13天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课12 集群版转换为单机版
本文介绍了如何将“共享存储实例”转换为“本地存储实例”,实验环境依赖于Docker容器中的loop设备模拟共享存储。具体步骤包括准备本地目录、停库、拷贝数据、修改配置文件并启动实例。通过这些操作,可以实现从共享存储到本地存储的平滑转换。相关系列文章详细记录了PolarDB RAC一写多读集群的搭建与管理,提供了丰富的实战经验。
18 2
|
13天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课18 通过pg_bulkload适配pfs实现批量导入提速
本文介绍了如何修改 `pg_bulkload` 工具以适配 PolarDB 的 PFS(Polar File System),从而加速批量导入数据。实验环境依赖于 Docker 容器中的 loop 设备模拟共享存储。通过对 `writer_direct.c` 文件的修改,替换了一些标准文件操作接口为 PFS 对应接口,实现了对 PolarDB 15 版本的支持。测试结果显示,使用 `pg_bulkload` 导入 1000 万条数据的速度是 COPY 命令的三倍多。此外,文章还提供了详细的步骤和代码示例,帮助读者理解和实践这一过程。
34 0
|
13天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课16 接入PostGIS全功能及应用举例
本文介绍了如何在PolarDB数据库中接入PostGIS插件全功能,实现地理空间数据处理。此外,文章还提供了使用PostGIS生成泰森多边形(Voronoi diagram)的具体示例,帮助用户理解其应用场景及操作方法。
29 0
|
13天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课10 计算节点全毁, 灾难恢复
本文介绍了在PolarDB RAC一写多读集群中,当所有计算节点(主机)故障仅剩共享存储时的修复方法。实验基于Docker容器和loop设备模拟共享存储环境。通过重建计算节点、恢复PolarDB实例及配置相关参数,最终成功恢复RW和RO节点的功能,确保数据完整性和集群正常运行。视频回放可在B站和YouTube上查看。
23 0

相关产品

  • 云原生分布式数据库 PolarDB-X