《PolarDB-X开源分布式数据库实战进阶》——PolarDB-X冷热数据归档(2)

本文涉及的产品
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核8GB 50GB
简介: 《PolarDB-X开源分布式数据库实战进阶》——PolarDB-X冷热数据归档(2)

《PolarDB-X开源分布式数据库实战进阶》——PolarDB-X冷热数据归档(1) https://developer.aliyun.com/article/1228565?groupCode=polardbforpg



image.png

 

数据的迁移流程如下:

 

从DN抽取需过期的数据,将数据传到CN节点,并往CN的本地磁盘写入ORC文件。异步地将写好的文件从本地磁盘装载到CN中,上传至OSS。使用DN上的数据与OSS数据做校验。

 

整个流程具有原子性保证,任何一步出错都会使整个迁移任务回滚,保证不会有任何残留。另外,数据校验是基于哈希的快速校验,可以保证数据的一致性。

 

迁移过程中,无论是CN宕机还是DN宕机,都可实现断点续传,而不是整个流程从头开始。由于迁移过程有比较强的性能要求,对DN和CN的压力较大,因此会在第二步构建时进行限速。迁移过程支持多个CN并行执行,实现线性加速。冷数据也可以轻松往InnoDB迁移。

 

image.png

 

TP查询能够实现较高的QPS,主要得益于裁剪能力。比如只需要访问一个列,则只需要从OSS上拉取一个列(列裁剪)。另外,在CN上做了分片后,可以将不需要访问的分片进行裁剪,继而无需访问所有ORC文件。

 

Orc文件本身是有MinMax、BloomFilter的剪裁能力,可以借助统计信息直接进行裁剪。

 

Demo演示

 

进入云起实验室“PolarDB-X冷热数据归档”课程,在实验页面点击“创建资源”,系统会自动创建ECS。

 

image.png

 

点击页面右上角切换到web terminal图标。

 

image.png

 

分别执行启动Docker、切换到galaxykube账号下启动minikube,集群创建成功,查看信息。再根据实验步骤安装operator,部署PolarDB-X集群。

 

image.png

 

连接PolarDB-X集群。首先查看端口、PolarDB-X集群的地址以及密码,连接数据库。

 

image.png




 《PolarDB-X开源分布式数据库实战进阶》——PolarDB-X冷热数据归档(3) https://developer.aliyun.com/article/1228562?groupCode=polardbforpg

相关文章
|
2月前
|
关系型数据库 分布式数据库 数据库
|
2月前
|
存储 关系型数据库 分布式数据库
喜报|阿里云PolarDB数据库(分布式版)荣获国内首台(套)产品奖项
阿里云PolarDB数据库管理软件(分布式版)荣获「2024年度国内首版次软件」称号,并跻身《2024年度浙江省首台(套)推广应用典型案例》。
|
4月前
|
关系型数据库 数据库 RDS
【瑶池数据库训练营及解决方案本周精选(探索PolarDB,参与RDS迁移、连接训练营)】(5.30-6.8)
本周精选聚焦数据库迁移训练营、快速连接云数据库RDS训练营及智能多模态搜索解决方案。为用户提供模拟教程与实战演练,学习RDS MySQL实例连接与数据管理技能,助力企业智能化发展。每周解锁数据库实战新场景,抓紧时间,精彩不容错过!
|
3月前
|
关系型数据库 分布式数据库 数据库
再获殊荣,阿里云PolarDB数据库蝉联SIGMOD最佳论文奖
内存池化技术新突破,阿里云PolarDB蝉联SIGMOD最佳论文奖
|
6月前
|
Cloud Native 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
阿里云PolarDB云原生数据库在TPC-C基准测试中以20.55亿tpmC的成绩刷新世界纪录,展现卓越性能与性价比。其轻量版满足国产化需求,兼具高性能与低成本,适用于多种场景,推动数据库技术革新与发展。
|
4月前
|
Cloud Native 关系型数据库 分布式数据库
阿里云PolarDB与沃趣科技携手打造一体化数据库解决方案,助推国产数据库生态发展
阿里云瑶池数据库与沃趣科技将继续深化合作,共同推动国产数据库技术的持续创新与广泛应用,为行业生态的繁荣注入更强劲的技术动力。
阿里云PolarDB与沃趣科技携手打造一体化数据库解决方案,助推国产数据库生态发展
|
2月前
|
关系型数据库 分布式数据库 数据库
阿里云PolarDB数据库蝉联SIGMOD最佳论文奖
阿里云PolarDB凭借全球首创基于CXL Switch的分布式内存池技术,在SIGMOD 2025上荣获工业赛道“最佳论文奖”,连续两年蝉联该顶会最高奖项。其创新架构PolarCXLMem打破传统RDMA技术瓶颈,性能提升2.1倍,并已落地应用于内存池化场景,推动大模型推理与多模态存储发展,展现CXL Switch在高速互联中的巨大潜力。
阿里云PolarDB数据库蝉联SIGMOD最佳论文奖
|
3月前
|
存储 监控 关系型数据库
突破IO瓶颈:PolarDB分布式并行查询(Parallel Query)深度调优手册
在海量数据处理中,I/O瓶颈严重制约数据库性能。本文基于PolarDB MySQL 8.0.32版本,深入解析分布式并行查询技术如何提升CPU利用率至86.7%、IO吞吐达8.5GB/s,并结合20+实战案例,系统讲解并行架构、执行计划优化、资源调优与故障排查方法,助力实现高性能数据分析。
118 6
|
3月前
|
Cloud Native 关系型数据库 分布式数据库
客户说|知乎基于阿里云PolarDB,实现最大数据库集群云原生升级
近日,知乎最大的风控业务数据库集群,基于阿里云瑶池数据库完成了云原生技术架构的升级。此次升级不仅显著提升了系统的高可用性和性能上限,还大幅降低了底层资源成本。
|
4月前
|
存储 Cloud Native 关系型数据库
PolarDB开源:云原生数据库的架构革命
本文围绕开源核心价值、社区运营实践和技术演进路线展开。首先解读存算分离架构的三大突破,包括基于RDMA的分布式存储、计算节点扩展及存储池扩容机制,并强调与MySQL的高兼容性。其次分享阿里巴巴开源治理模式,涵盖技术决策、版本发布和贡献者成长体系,同时展示企业应用案例。最后展望技术路线图,如3.0版本的多写多读架构、智能调优引擎等特性,以及开发者生态建设举措,推荐使用PolarDB-Operator实现高效部署。
253 3

相关产品

  • 云原生数据库 PolarDB