PolarDB-X 冷热数据归档(二)| 学习笔记

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
简介: 快速学习 PolarDB-X 冷热数据归档。

开发者学堂课程【PolarDB-X开源分布式数据库进阶课程 :PolarDB-X 冷热数据归档(二)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/1202/detail/18331


PolarDB-X 冷热数据归档


四、演示内容

image.png

首先点击创建资源,创建成功回到试验手册,首先第一步切换,第二步启动 docer 回车,切入到空白账号进入目录。

创建成功后查看信息,然后执行第六步安装,开始部署集群,星星四分钟的等待集群的创建成功然后就可以退出查看。

现在开始连接集群和数据源查看端口或者 dbs 集群地址,第三步查看密码,第四步连接数据库,连接成功。第五步创建冷数据源,查看冷数据源是否创建成功。安装,新开一个终端验证是否安装成功。

image.png

成功后找到对应的弹性 ip,并使用端口进行连接。安装成功后连接数据库。主机ip地址使用刚才连接串中的ip。主机端口、用户名、密码如图。

image.png

建库模式设置提交,接下来第六步进行冷数据的测试。导入配置然后四张表的大小设置成10万并发设置成1。导入成功回到命令行,创建冷数据表并进行数据归档。

image.png

回车,归档表全部生成好,点击切换库,全部切回 coad 发现有四张表全部都是十万行。现在都是冷数据表。第六步对冷数据进行压制,按照配置四张表,单表大小为十万并发数设置为4,进行一分钟负载类型设置为 readlonly,提交。

image.png

开始压测,qbs400到500之间,延迟大概在200毫秒,这是最后的一个统计结果。

image.png

可以看到冷数据压测的结果 qbs 有500,第七步验证 AP 查询能力,首先对冷热数据进行验证查询,收集。先收集热数据,再切换到冷数据库进行收集。这样一个 AP 查询的执行计划。查出来的语法可以看到是对的两张冷数据查询和扫描表的操作。接下来进行冷热数据关联查询,看一下执行计划主要的不同点在于2这张表是热数据表,执行后得到完全一样的结果。

最后演示一下TTL的自动归档,首先创建一张 TTL orger 的表,它的语意是从六月一号开始每隔一个月建一张表,两个月后过期,我们会预先分配五个月,建表然后往里面倒数据,一共是1408行数据,查看一下这张表的时间,从现在的时间来看,应该会有这些表需要过期,在运维窗口。第四步进行数据的绑定,T_order 这张表会往它逐渐过期,它的意思是我们按照月份排序,统计出来五六七月各有120条,如果想过期,预期会把这个部分数据过期到 oss 中,手动过期发现五月份的已经不在原表。接下来使用手动触发的方式模拟冷数据自动过期,首先修改运维窗口,自动过期都是用定时任务的形式来决定,先看 T_order 表的自动过期任务,默认一点钟开始,它的 id 是后面要用到的,可以手动触发过期。可以看到是过期的九月八月七月一号的数据,之前六月七月八月都被过期都 T_order,他现在最老的表是11.1号到12.1号过期。

 

五、演示

image.png

刚才的演示主要是三个部分,第一个是归档表的 TP 查询能力。

image.png

此外它有 AP 查询的能力,这张图是 TB100的测试结果,是比 innoDB 的测试结果性能还要更好,由于实验室配置有限,我们并没有真正跑 TBche 的实验,自己有兴趣可以去直接导入。

image.png

第三个部分是演示的 TTL 冷热分离的能力,会自动把过期数据迁移到os

image.png

我们简单介绍一下原理,数据的迁移流程大概是第一步从 DN 抽取过期的数据,第二步将过期的数据传到 CN 节点并往 CN 的本地磁盘写入 orc 文件,第三步将写好的文件从本地磁盘装载到 CN 中,然后上传给 OSS,第五步用 CN 上的数据和 Oss 做校验,这样就是一个完整迁移流程,是有原则性保证,任何一步出错,比如说第五步发现校验校验不一致它会整个回滚,保证不会残留。

另外这一步的校验,可以保证数据的一致性,第三这个迁移过程中不管是 CN 还是 DN 当机都不会做到断点续传。第四由于迁徙过程有比较强的性能要求,对 DN 和 CN 的压力比较大,所以这个过程会在第二步构建的时候进行限速。第五步这个迁移过程可以做到多个并行,可以进行加速。主要演示了 DN 往 oss 迁移的过程,实际上冷数据也可以往osdb 做迁移,如果想有更强的写入能力。

多级裁剪

·列裁剪

·分区裁剪

·统计信息裁剪 MinMax、Bloom Filter

刚才的 TP 查询能够做到比较高的 qbs,主要是有一些这样的裁剪能力,比如说你要访问只需要从 oss 拉取一个列裁剪。另外在 CN 上做了分辨后只需要一个裁剪,不需要所有的 orc 文件。第三 orc 文件本来是有 MinMax、Bloom Filter 这样的信息,直接进行裁剪。

 

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
相关文章
|
关系型数据库 测试技术 数据库连接
实践教程之使用PolarDB-X进行冷热数据归档
PolarDB-X 为了方便用户体验,提供了免费的实验环境,您可以在实验环境里体验 PolarDB-X 的安装部署和各种内核特性。除了免费的实验,PolarDB-X 也提供免费的视频课程,手把手教你玩转 PolarDB-X 分布式数据库。
|
5月前
|
存储 SQL Cloud Native
揭秘!PolarDB-X存储引擎如何玩转“时间魔术”?Lizard多级闪回技术让你秒回数据“黄金时代”!
【8月更文挑战第25天】PolarDB-X是一款由阿里巴巴自主研发的云原生分布式数据库,以其高性能、高可用性和出色的可扩展性著称。其核心竞争力之一是Lizard存储引擎的多级闪回技术,能够提供高效的数据恢复与问题诊断能力。本文通过一个电商公司的案例展示了一级与二级闪回技术如何帮助快速恢复误删的大量订单数据,确保业务连续性不受影响。一级闪回通过维护最近时间段内历史数据版本链,支持任意时间点查询;而二级闪回则通过扩展数据保留时间并采用成本更低的存储方式,进一步增强了数据保护能力。多级闪回技术的应用显著提高了数据库的可靠性和灵活性,为企业数据安全保驾护航。
58 1
|
5月前
|
数据库 Windows
超详细步骤解析:从零开始,手把手教你使用 Visual Studio 打造你的第一个 Windows Forms 应用程序,菜鸟也能轻松上手的编程入门指南来了!
【8月更文挑战第31天】创建你的第一个Windows Forms (WinForms) 应用程序是一个激动人心的过程,尤其适合编程新手。本指南将带你逐步完成一个简单WinForms 应用的开发。首先,在Visual Studio 中创建一个“Windows Forms App (.NET)”项目,命名为“我的第一个WinForms 应用”。接着,在空白窗体中添加一个按钮和一个标签控件,并设置按钮文本为“点击我”。然后,为按钮添加点击事件处理程序`button1_Click`,实现点击按钮后更新标签文本为“你好,你刚刚点击了按钮!”。
380 0
|
7月前
|
关系型数据库 MySQL 分布式数据库
PolarDB产品使用问题之从MySQL迁移数据到PolarDB-X时,自定义函数不会自动迁移,该怎么办
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
128 1
|
8月前
|
JSON 关系型数据库 分布式数据库
PolarDB常见问题之PolarDB8.0.1使用冷热混合分区失败如何解决
PolarDB是阿里云推出的下一代关系型数据库,具有高性能、高可用性和弹性伸缩能力,适用于大规模数据处理场景。本汇总囊括了PolarDB使用中用户可能遭遇的一系列常见问题及解答,旨在为数据库管理员和开发者提供全面的问题指导,确保数据库平稳运行和优化使用体验。
|
8月前
|
存储 数据可视化 关系型数据库
绘制圆环图/雷达图/星形图/极坐标图/径向图POLAR CHART可视化分析汽车性能数据
绘制圆环图/雷达图/星形图/极坐标图/径向图POLAR CHART可视化分析汽车性能数据
|
8月前
|
存储 关系型数据库 分布式数据库
PolarDB-X最佳实践系列(五):使用通义千问和存储过程快速生成测试数据
我们在测试数据库性能的过程中,通常需要生成一批测试数据。 以前,一般要写一段程序或者脚本来完成这项工作,但现在是2024年啦!时代变了!
PolarDB-X最佳实践系列(五):使用通义千问和存储过程快速生成测试数据
|
8月前
|
存储 监控 关系型数据库
drds数据分布不均
drds数据分布不均
113 1
|
存储 关系型数据库 MySQL
存储成本最高降至原来的5%,PolarDB分布式冷数据归档的业务实践
国内某家兼具投资理财、文化旅游、票务为一体的大型综合型集团公司,2015年成立至今,由于业务高速发展,业务数据增长非常快,数据库系统屡次不堪重负。该公司数据库运维总监介绍,他们目前业务压力比较大的是票务和订单系统,他们的平台每天新增几千万的订单数据,订单的数据来自于各个终端,近几年每个月以300G的数据规模在高速增长,由于数据不断增加,数据库系统迄今为止迭代过了3次。
|
8月前
|
存储 关系型数据库 MySQL
PolarDB-X on OSS: 冷热数据分离存储
在即将发布的PolarDB-X 5.4.14版本中,我们将基于OSS存储服务,推出冷热数据分离存储这一新功能。在这一功能的基础上,您可以便捷地将冷数据从源表中剥离出来,归档至更低成本的OSS中,形成一张归档表;归档表支持高效的主键与索引点查、复杂分析型查询,满足高可用、MySQL兼容性和任意时间点闪回等特性。您可以像访问MySQL表一样来访问归档表,也可以用开源大数据产品接入OSS的归档数据。
208 0
PolarDB-X on OSS: 冷热数据分离存储