OBCP第八章 OB运维、监控与异常处理-灾难恢复

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,高可用系列 2核4GB
日志服务 SLS,月写入数据量 50GB 1个月
简介: OBCP第八章 OB运维、监控与异常处理-灾难恢复

灾难恢复是指当数据库中的数据在被有意或无意破坏后复原数据库所需要执行的活动


回收站:回收站在原理上说就是一个数据字典表,放置用户删除的数据库对象信息。用户删除的东西被放入回收站后,其实仍然占据着物理空间,除非您手动进行清除( PURGE )或者对象定期被数据库系统删除


闪回查询:OceanBase提供了记录级别的闪回查询功能,允许用户获取某个历史版本的数据;OceanBase 数据库当前支持通过以下两种方式来进行闪回查询:


创建 Restore Point:当创建了 Restore Point,则可使用闪回查询功能查询 Restore Point 点对应的数据版本


设置undo_retention变量:设置 undo_retention 变量后,可使用闪回查询功能查询当前时间 T 到 T -undo_retention 时间范围内的任意多版本数据

回收站

查看回收站:

使用SHOW RECYCLEBIN语句


开关回收站:(租户中默认回收站为关闭状态)


租户级别的开启关闭语句:set global ‘recyclebin’=on/off;


Session级别的开启关闭语句:set @@recyclebin=on/off;


支持进入回收站的对象有索引、表、库和租户,各模式回收站对象的支持情况如下表所示:

模式 索引 数据库 租户
MySQL 支持 支持 支持 支持
Oracle 支持 支持 不支持 不支持

回收站


恢复回收站数据:使用FLASHBACK命令恢复回收站中的数据库和表对象,只有租户的管理员用户才可以使用该命令

FLASHBACK DATABASE<object_name> TO BEFORE DROP [RENAME TO database_name];
FLASHBACK TABLE<object_name> TO BEFORE DROP [RENAME to table_name];

回收站清理:回收站中的数据可以通过 PURGE 命令清理;当一个对象的上层对象被PURGE,那么当前回收站中关联的下一层对象也会被 PURGE


指定库物理删除: PURGE DATABASE <object_name>;


指定表物理删除: PURGE TABLE <object_name>;


指定索引表物理删除: PURGE INDEX <object_name>;


清空整个回收站: PURGE RECYCLEBIN;

闪回查询

闪回查询(Flashback Query)是 Oracle 中记录级别的闪回功能。该功能允许用户获取某个历史版本的数据。OB同时支持MySQL和Oracle两种模式下的查询


闪回查询支持 SCN(time_to_usec())和 TIMESTAMP(usec_to_time())两种维度的查询

示例 1:通过 TIMESTAMP 指定的历史时间并闪回查询一张单表在该历史时间中的状态的数据:

select * from tbl1 as of timestamp TO_TIMESTAMP('2020-08-13 16:20:00','yyyy-mm-dd hh24:mi:ss');

示例 2:通过 TIMESTAMP 指定的历史时间并闪回查询多表在该历史时间中的状态的数据:

select * from tbl1 as of timestamp TO_TIMESTAMP('2020-08-13 16:20:00','yyyy-mm-dd hh24:mi:ss'),tbl2 as of timestamp TO_TIMESTAMP('2020-08-13 16:20:00','yyyy-mm-dd hh24:mi:ss');

示例3:通过 SCN 指定历史时间并闪回查询单表在该历史时间点的状态的数据:

select * from tbl1 as of scn 1582807800000000;

restore point

创建restore point:(租户级)

CREATE RESTORE POINT restore_point;

查询restore point:

SELECT * FROM V$RESTORE_POINT;

查询历史数据:

MySQL模式

SELECT * FROM table_name AS OF SNAPSHOT 10000;

Oracle模式

SELECT * FROM table_name AS OF SCN 10000;

删除 restore point:保留的 restore point 对应的数据会占用相应的存储资源,在分析业务结束后需要手动执行删除 restore point 的操作

DROP RESTORE POINT restore_point;

Restore Point功能的使用限制


不支持物理备份


不支持主备库


不支持在sys租户下创建Restore Point


每个租户内最多可创建10个Restore Point


创建Restore Point后,如果对创建Restore Point前就存在的表执行DDL语句将会报错。

小结:

OB的日志分为可读的服务日志和二进制的事务日志


Clog包括redo log, prepare log, commit log, abort log, clear log,但是不包括undo log


Observer日志级别按严重程度从高到低分为ERROR、USER_ERR、WARN、INFO(default)、TRACE、DEBUG


Observer MySQL模式错误代码4000以前兼容MySQL,4000以后为OB自有的错误码


OB集群在运维过程中,“STOP”命令代表不提供leader副本服务,(如“stop server”代表该observer所有主副


本都被切走)


OB在MySQL模式下,回收站支持INDEX、TABLE、DATABASE、TENANT,在Oracle模式下支持INDEX(3.x)和TABLE


相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
5月前
|
消息中间件 运维 监控
智能运维,由你定义:SAE自定义日志与监控解决方案
通过引入 Sidecar 容器的技术,SAE 为用户提供了更强大的自定义日志与监控解决方案,帮助用户轻松实现日志采集、监控指标收集等功能。未来,SAE 将会支持 istio 多租场景,帮助用户更高效地部署和管理服务网格。
407 52
|
4月前
|
运维 监控 中间件
Linux运维笔记 - 如何使用WGCLOUD监控交换机的流量
WGCLOUD是一款开源免费的通用主机监控工具,安装使用都非常简单,它可以监控主机、服务器的cpu、内存、磁盘、流量等数据,也可以监控数据库、中间件、网络设备
|
6月前
|
数据采集 运维 监控
数据采集监控与告警:错误重试、日志分析与自动化运维
本文探讨了数据采集技术从“简单采集”到自动化运维的演进。传统方式因反爬策略和网络波动常导致数据丢失,而引入错误重试、日志分析与自动化告警机制可显著提升系统稳定性与时效性。正方强调健全监控体系的重要性,反方则担忧复杂化带来的成本与安全风险。未来,结合AI与大数据技术,数据采集将向智能化、全自动方向发展,实现动态调整与智能识别反爬策略,降低人工干预需求。附带的Python示例展示了如何通过代理IP、重试策略及日志记录实现高效的数据采集程序。
286 7
数据采集监控与告警:错误重试、日志分析与自动化运维
|
6月前
|
消息中间件 运维 监控
智能运维,由你定义:SAE自定义日志与监控解决方案
SAE(Serverless应用引擎)是阿里云推出的全托管PaaS平台,致力于简化微服务应用开发与管理。为满足用户对可观测性和运维能力的更高需求,SAE引入Sidecar容器技术,实现日志采集、监控指标收集等功能扩展,且无需修改主应用代码。通过共享资源模式和独立资源模式,SAE平衡了资源灵活性与隔离性。同时,提供全链路运维能力,确保应用稳定性。未来,SAE将持续优化,支持更多场景,助力用户高效用云。
|
8月前
|
监控 运维
HTTPS 证书自动化运维:https证书管理系统- 自动化监控
本文介绍如何设置和查看域名或证书监控。步骤1:根据证书状态选择新增域名或证书监控,线上部署推荐域名监控,未部署选择证书监控。步骤2:查询监控记录详情。步骤3:在详情页查看每日定时检测结果或手动测试。
HTTPS 证书自动化运维:https证书管理系统- 自动化监控
|
9月前
|
Prometheus 运维 监控
Prometheus+Grafana+NodeExporter:构建出色的Linux监控解决方案,让你的运维更轻松
本文介绍如何使用 Prometheus + Grafana + Node Exporter 搭建 Linux 主机监控系统。Prometheus 负责收集和存储指标数据,Grafana 用于可视化展示,Node Exporter 则采集主机的性能数据。通过 Docker 容器化部署,简化安装配置过程。完成安装后,配置 Prometheus 抓取节点数据,并在 Grafana 中添加数据源及导入仪表盘模板,实现对 Linux 主机的全面监控。整个过程简单易行,帮助运维人员轻松掌握系统状态。
1236 3
|
10月前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第27天】在智能运维中,Prometheus和Grafana的组合已成为监控和告警体系的事实标准。Prometheus负责数据收集和存储,支持灵活的查询语言PromQL;Grafana提供数据的可视化展示和告警功能。本文介绍如何配置Prometheus监控目标、Grafana数据源及告警规则,帮助运维团队实时监控系统状态,确保稳定性和可靠性。
915 0
|
4月前
|
数据采集 机器学习/深度学习 人工智能
运维人的“福音”?AI 驱动的自动化网络监控到底香不香!
运维人的“福音”?AI 驱动的自动化网络监控到底香不香!
319 0
|
25天前
|
人工智能 运维 安全
运维老哥的救星?AI 驱动的自动化配置管理新趋势
运维老哥的救星?AI 驱动的自动化配置管理新趋势
80 11
|
3月前
|
机器学习/深度学习 人工智能 运维
运维不背锅,从“自动修锅”开始:AI自动化运维是怎么回事?
运维不背锅,从“自动修锅”开始:AI自动化运维是怎么回事?
294 49