OBCP第八章 OB运维、监控与异常处理-灾难恢复

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: OBCP第八章 OB运维、监控与异常处理-灾难恢复

灾难恢复是指当数据库中的数据在被有意或无意破坏后复原数据库所需要执行的活动


回收站:回收站在原理上说就是一个数据字典表,放置用户删除的数据库对象信息。用户删除的东西被放入回收站后,其实仍然占据着物理空间,除非您手动进行清除( PURGE )或者对象定期被数据库系统删除


闪回查询:OceanBase提供了记录级别的闪回查询功能,允许用户获取某个历史版本的数据;OceanBase 数据库当前支持通过以下两种方式来进行闪回查询:


创建 Restore Point:当创建了 Restore Point,则可使用闪回查询功能查询 Restore Point 点对应的数据版本


设置undo_retention变量:设置 undo_retention 变量后,可使用闪回查询功能查询当前时间 T 到 T -undo_retention 时间范围内的任意多版本数据

回收站

查看回收站:

使用SHOW RECYCLEBIN语句


开关回收站:(租户中默认回收站为关闭状态)


租户级别的开启关闭语句:set global ‘recyclebin’=on/off;


Session级别的开启关闭语句:set @@recyclebin=on/off;


支持进入回收站的对象有索引、表、库和租户,各模式回收站对象的支持情况如下表所示:

模式 索引 数据库 租户
MySQL 支持 支持 支持 支持
Oracle 支持 支持 不支持 不支持

回收站


恢复回收站数据:使用FLASHBACK命令恢复回收站中的数据库和表对象,只有租户的管理员用户才可以使用该命令

FLASHBACK DATABASE<object_name> TO BEFORE DROP [RENAME TO database_name];
FLASHBACK TABLE<object_name> TO BEFORE DROP [RENAME to table_name];

回收站清理:回收站中的数据可以通过 PURGE 命令清理;当一个对象的上层对象被PURGE,那么当前回收站中关联的下一层对象也会被 PURGE


指定库物理删除: PURGE DATABASE <object_name>;


指定表物理删除: PURGE TABLE <object_name>;


指定索引表物理删除: PURGE INDEX <object_name>;


清空整个回收站: PURGE RECYCLEBIN;

闪回查询

闪回查询(Flashback Query)是 Oracle 中记录级别的闪回功能。该功能允许用户获取某个历史版本的数据。OB同时支持MySQL和Oracle两种模式下的查询


闪回查询支持 SCN(time_to_usec())和 TIMESTAMP(usec_to_time())两种维度的查询

示例 1:通过 TIMESTAMP 指定的历史时间并闪回查询一张单表在该历史时间中的状态的数据:

select * from tbl1 as of timestamp TO_TIMESTAMP('2020-08-13 16:20:00','yyyy-mm-dd hh24:mi:ss');

示例 2:通过 TIMESTAMP 指定的历史时间并闪回查询多表在该历史时间中的状态的数据:

select * from tbl1 as of timestamp TO_TIMESTAMP('2020-08-13 16:20:00','yyyy-mm-dd hh24:mi:ss'),tbl2 as of timestamp TO_TIMESTAMP('2020-08-13 16:20:00','yyyy-mm-dd hh24:mi:ss');

示例3:通过 SCN 指定历史时间并闪回查询单表在该历史时间点的状态的数据:

select * from tbl1 as of scn 1582807800000000;

restore point

创建restore point:(租户级)

CREATE RESTORE POINT restore_point;

查询restore point:

SELECT * FROM V$RESTORE_POINT;

查询历史数据:

MySQL模式

SELECT * FROM table_name AS OF SNAPSHOT 10000;

Oracle模式

SELECT * FROM table_name AS OF SCN 10000;

删除 restore point:保留的 restore point 对应的数据会占用相应的存储资源,在分析业务结束后需要手动执行删除 restore point 的操作

DROP RESTORE POINT restore_point;

Restore Point功能的使用限制


不支持物理备份


不支持主备库


不支持在sys租户下创建Restore Point


每个租户内最多可创建10个Restore Point


创建Restore Point后,如果对创建Restore Point前就存在的表执行DDL语句将会报错。

小结:

OB的日志分为可读的服务日志和二进制的事务日志


Clog包括redo log, prepare log, commit log, abort log, clear log,但是不包括undo log


Observer日志级别按严重程度从高到低分为ERROR、USER_ERR、WARN、INFO(default)、TRACE、DEBUG


Observer MySQL模式错误代码4000以前兼容MySQL,4000以后为OB自有的错误码


OB集群在运维过程中,“STOP”命令代表不提供leader副本服务,(如“stop server”代表该observer所有主副


本都被切走)


OB在MySQL模式下,回收站支持INDEX、TABLE、DATABASE、TENANT,在Oracle模式下支持INDEX(3.x)和TABLE


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2月前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
338 3
|
28天前
|
Prometheus 运维 监控
Prometheus+Grafana+NodeExporter:构建出色的Linux监控解决方案,让你的运维更轻松
本文介绍如何使用 Prometheus + Grafana + Node Exporter 搭建 Linux 主机监控系统。Prometheus 负责收集和存储指标数据,Grafana 用于可视化展示,Node Exporter 则采集主机的性能数据。通过 Docker 容器化部署,简化安装配置过程。完成安装后,配置 Prometheus 抓取节点数据,并在 Grafana 中添加数据源及导入仪表盘模板,实现对 Linux 主机的全面监控。整个过程简单易行,帮助运维人员轻松掌握系统状态。
200 3
|
2月前
|
消息中间件 数据采集 运维
一份运维监控的终极秘籍!监控不到位,宕机两行泪
【10月更文挑战第25天】监控指标的采集分为基础监控和业务监控。基础监控涉及CPU、内存、磁盘等硬件和网络信息,而业务监控则关注服务运行状态。常见的监控数据采集方法包括日志、JMX、REST、OpenMetrics等。Google SRE提出的四个黄金指标——错误、延迟、流量和饱和度,为监控提供了重要指导。错误监控关注系统和业务错误;延迟监控关注服务响应时间;流量监控关注系统和服务的访问量;饱和度监控关注服务利用率。这些指标有助于及时发现和定位故障。
274 1
|
3月前
|
运维 Prometheus 监控
运维之眼:监控的艺术与实践
在信息技术飞速发展的今天,运维监控已成为保障系统稳定运行的关键。本文将探讨运维监控的重要性,介绍常用的监控工具和方法,并通过实际案例分析,展示如何有效地实施监控策略,以确保系统的高可用性和性能。
|
3月前
|
运维 监控 测试技术
构建高效运维体系:从监控到自动化的实践之路
【10月更文挑战第9天】 在当今信息技术飞速发展的时代,运维作为保障系统稳定性与效率的关键角色,正面临前所未有的挑战。本文将探讨如何通过构建一个高效的运维体系来应对这些挑战,包括监控系统的搭建、自动化工具的应用以及故障应急处理机制的制定。我们将结合具体案例,分析这些措施如何帮助提升系统的可靠性和运维团队的工作效率。
73 1
|
3月前
|
运维 监控 安全
构建高效运维体系:从监控到自动化的全面指南在当今数字化时代,运维作为保障系统稳定性和效率的重要环节,其重要性不言而喻。本文将深入探讨如何构建一个高效的运维体系,从监控系统的搭建到自动化运维的实施,旨在为读者提供一套完整的解决方案。
本文详细介绍了高效运维体系的构建过程,包括监控系统的选择与部署、日志分析的方法、性能优化的策略以及自动化运维工具的应用。通过对这些关键环节的深入剖析,帮助运维人员提升系统的可靠性和响应速度,降低人工干预成本,实现业务的快速发展和稳定运行。
|
2月前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第27天】在智能运维中,Prometheus和Grafana的组合已成为监控和告警体系的事实标准。Prometheus负责数据收集和存储,支持灵活的查询语言PromQL;Grafana提供数据的可视化展示和告警功能。本文介绍如何配置Prometheus监控目标、Grafana数据源及告警规则,帮助运维团队实时监控系统状态,确保稳定性和可靠性。
322 0
|
3月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
84 4
|
17天前
|
人工智能 运维 监控
AI辅助的运维流程自动化:实现智能化管理的新篇章
AI辅助的运维流程自动化:实现智能化管理的新篇章
354 22
|
10天前
|
Kubernetes Java 持续交付
小团队 CI/CD 实践:无需运维,Java Web应用的自动化部署
本文介绍如何使用GitHub Actions和阿里云Kubernetes(ACK)实现Java Web应用的自动化部署。通过CI/CD流程,开发人员无需手动处理复杂的运维任务,从而提高效率并减少错误。文中详细讲解了Docker与Kubernetes的概念,并演示了从创建Kubernetes集群、配置容器镜像服务到设置GitHub仓库Secrets及编写GitHub Actions工作流的具体步骤。最终实现了代码提交后自动构建、推送镜像并部署到Kubernetes集群的功能。整个过程不仅简化了部署流程,还确保了应用在不同环境中的稳定运行。
49 9

热门文章

最新文章