事务日志,备份与恢复

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
日志服务 SLS,月写入数据量 50GB 1个月
简介:

当一切正常时,没有必要特别留意什么是事务日志,它是如何工作的。你只要确保每个数据库都有正确的备份。当出现问题时,事务日志的理解对于采取修正操作是重要的,尤其在需要紧急恢复数据库到指定点时。这系列文章会告诉你每个DBA应该知道的具体细节。


它不会经常提起,除非你的数据库运行在简单(SIMPLE)恢复模式,在事务日志上定期备份非常重要的。这会控制事务日志大小,并且保证,在灾难发生里,你可以恢复你的数据库到灾难发生前的某个时间点。这些日志备份要和定期的完整数据库(数据文件)备份一起。

如果你在测试数据库上工作,不需要恢复到先前的某个时间点,或者会乐意恢复到上次完整备份,那你就可以在简单模式里运行数据库。

我们来详细讨论下这些问题。

备份的重要性

考虑下,例如SQL Server数据库“崩溃”的情况里,可能是硬件故障,“活生生”的数据文件(mdf和ndf文件),和事务日志文件都不能访问了。

最坏的情况,其它地方不存在这些文件备份(副本),那你会遭受100%的数据丢失。为了保证你能恢复数据库,且数据恢复到服务器崩溃前存在的某个时间点,或者恢复到数据因为其他原因丢失或损坏前,DBA需要同时为数据和日志文件做定期备份。

DBA可以进行3个主要类型的备份(但是当在简单(SIMPLE)恢复模式时只有前2个可以应用)

  • 完整数据库备份——在数据库里备份所有的数据。对提供的数据库,这本质是制作MDF文件副本。
  • 差异数据库备份——自上次备份后,制作已改变的任何数据的副本。
  • 事务日志备份——自上次事务日志备份,制作插入到事务日志的所有日志记录的副本(如果在简单(SIMPLE)恢复模式里,是数据库检查点)。当日志备份完成时,通常日志被截断,这样的话文件里的空间可以被重用,但是一些因素可以延迟这个(看第8篇——救命,我的日志满了。)

一些初级的DBA和很多开发者,可能会被“完整”误解,误认为完整备份备份“一切”;数据和事务日志内容同时备份。这是不对的。本质上,完整和差异备份同时只备份数据,尽管它们也备份足够的事务日志来启用备份数据的恢复,当数据库在备份时,重现任何改变。但是,实际上,完整数据库备份不备份事务日志,也不会导致事务日志的截断。只有事务日志备份会造成日志的截断,因此在生产环境里,进行日志备份是唯一控制日志文件大小的正确方法。在第8篇——救命,我的日志满了会讨论一些常见但不正确的方式。

文件和文件组备份

大的数据库有时会由多个文件组组织,是可以在各个文件组、或文件组里的文件上进行完整和差异备份,而不是备份整个数据库。对此以后在以后的文章里不会详谈。

恢复模式

SQL Server数据库备份和恢复操作发生在数据库恢复模式的上下文里。恢复模式是决定你是否需要(或甚至可以)备份事务日志和操作如何记录的数据库属性。对于可用恢复操作,还有页粒度和文件恢复都有一些不同,但这个系列文章不会讨论这些。

一般来说,数据库会运行在简单和完整恢复模式,它们之间的重用区别如下:

  • 简单(SIMPLE)——事务日志只用作数据库恢复和回滚操作。在检查点期间是自动截断。它不会被备份,因此它不能用于还原数据库到过去存在的某个时间点。
  • 完整(FULL)——事务日志在检查点期间不会自动截断,因此可以被备份并用来还原数据到先前的某个时间点,也用作数据库恢复和回滚。只有当日志备份发生时,日志文件会截断。

还有第3个模式,大容量日志(BULK_LOGGED),在这个特定操作里,通常会生成很多写入到事务日志,为了不淹没事务日志而进行很少的记录。

不能最小记录的操作

可以被最小记录的操作包括大容量导入操作(例如使用BCP或BULK INSERT),SELECT/INTO操作和特定索引操作(例如索引重建)。完整列表可以在这里找到:https://msdn.microsoft.com/zh-cn/library/ms191244.aspx

选择正确的恢复模式

在完整恢复模式和简单恢复模式之间选择的最重要标准是:你愿意冒丢失多少数据的风险?

在简单恢复模式里,只有完整和差异备份。比方说你完全依赖完整备份,在每天早上2点进行完整备份,有一天服务器在早上1点的时候服务器经历了一次致命的崩溃。在这个情况里,你只能恢复前一个早上2点的完整数据库备份,会丢失23个小时的数据。

在完整备份之间可以进行差异备份,来减少数据丢失的风险。所有的备份都有密集的I/O流程,对于完整备份更是名副其实,其次是差异备份。他们很可能影响数据库的性能,当用户们正在访问数据库时不应该运行。实际上,如果你运行在简单恢复模式,数据丢失的风险是几个小时。

如果数据库存放关键业务数据,你会更喜欢数据丢失是几分钟而不是几个小时,那样的话你需要运行数据库在完整恢复模式。在这个模式里,你需要进行一次完整数据备份,然后是一系列定期的事务日志备份,再又是另一个完整备份,这样反复进行。

在这个情况下,理论上你可以恢复最近的可靠完整备份(加上最近的差异备份,如果有的话),接下来是可用日志备份链,自上次完整或差异备份后。然后,在恢复过程中,在备份日志里的所有记录的操作会前滚,将数据库恢复到非常接近于灾难时间。

日志文件备份的频率多少会再次取决于你准备丢失的数据,加上你服务器上的工作量。在重要的金融或会计应用上,对于数据丢失的容忍几乎为零,那样的话你可以每15分钟备份一次日志,甚至可以更高频率。在刚才的备份例子里,意味着你可以恢复上午2点的完整备份,然后按顺序应用每个日志文件备份,假设你有自用作数据库恢复基础的完整备份,有完整扩展的日志链(log chain)到上午12点45分,刚好在数据库崩溃前15分钟。事实上,崩溃后当前的日志还是可以访问的,允许你进行尾日志备份(tail log backup),你可以最小化你的数据丢失接近为0。

日志链和尾日志备份……

会在第5篇——完整恢复模式里的日志管理里详细介绍。

当然,使用完整备份会带来更多的维护,创建和监控用来频繁运行事务日志备份的作业,这些都要额外工作,这些备份需要I/O资源(尽管只是短时间),需要磁盘空间来存储大数量的备份文件。对数据库选择合适的恢复模式前,在业务层面,这些都要慎重考虑这些。

设置和切换恢复模式

恢复模式可以使用下列简单的命令进行设置。

复制代码
 1 USE master;
 2 
 3 -- set recovery model to FULL
 4 ALTER DATABASE TestDB
 5 SET RECOVERY FULL;
 6 
 7 -- set recovery model to SIMPLE
 8 ALTER DATABASE TestDB
 9 SET RECOVERY SIMPLE;
10 
11 -- set recovery model to BULK_LOGGED
12 ALTER DATABASE TestDB
13 SET RECOVERY BULK_LOGGED;
复制代码

数据库会调整到model数据库设置的默认恢复模式。在大多数情况下,这会意味着对于数据库的“默认”恢复模式是完整,但SQL Server的不同版本,对于model数据库会有不同的默认配置。

探索恢复模式

理论上,我们可以使用下列查询找出数据库使用的模式。

复制代码
1 SELECT   name ,
2          recovery_model_desc
3 FROM     sys.databases
4 WHERE    name = 'TestDB' ;
5 GO
复制代码

但是,对这个查询要小心,因为它可能没告诉真相。例如,如果我们创建一个新的数据库,然后立即运行刚才的命令。它会报告这个数据库运行在完整恢复模式下。但事实上,直到完整备份已完成前,数据库会运行在自动-截断模式(即简单模式)。

我们可以在SQL Server实例上创建一个新的数据库来验证这个,默认的恢复模式是完整。我们创建有一些测试数据的表,然后检查下恢复模式。

复制代码
 1 /* STEP 1: CREATE THE DATABASE*/
 2 USE master ;
 3 
 4 IF EXISTS ( SELECT  name
 5             FROM    sys.databases
 6             WHERE   name = 'TestDB' ) 
 7     DROP DATABASE TestDB ;
 8 
 9 CREATE DATABASE TestDB ON
10 (
11   NAME = TestDB_dat,
12   FILENAME = 'C:\Program Files\Microsoft SQL Server\MSSQL10_50.MSSQLSERVER\MSSQL\DATA\TestDB.mdf'
13 ) LOG ON
14 (
15   NAME = TestDB_log,
16   FILENAME = 'C:\Program Files\Microsoft SQL Server\MSSQL10_50.MSSQLSERVER\MSSQL\Data\TestDB.ldf'
17 ) ;
18 
19 /*STEP 2: INSERT A MILLION ROWS INTO A TABLE*/
20 USE TestDB
21 GO
22 IF OBJECT_ID('dbo.LogTest', 'U') IS NOT NULL 
23     DROP TABLE dbo.LogTest ;
24 SELECT TOP 1000000
25   SomeID = IDENTITY( INT,1,1 ),
26   SomeInt = ABS(CHECKSUM(NEWID())) % 50000 + 1 ,
27   SomeLetters2 = CHAR(ABS(CHECKSUM(NEWID())) % 26 + 65)
28   + CHAR(ABS(CHECKSUM(NEWID())) % 26 + 65) ,
29   SomeMoney = CAST(ABS(CHECKSUM(NEWID())) % 
30                      10000 / 100.0 AS MONEY) ,
31   SomeDate = CAST(RAND(CHECKSUM(NEWID()))
32                    * 3653.0 + 36524.0 AS DATETIME) ,
33   SomeHex12 = RIGHT(NEWID(), 12)
34 INTO    dbo.LogTest
35 FROM    sys.all_columns ac1
36         CROSS JOIN sys.all_columns ac2 ;
37 
38 SELECT   name ,
39          recovery_model_desc
40 FROM     sys.databases
41 WHERE    name = 'TestDB' ;
42 GO
复制代码

这表示我们运行在完整恢复模式,但现在我们检查下日式空间使用

1 DBCC SQLPERF(LOGSPACE) ;
2 -- DBCC SQLPERF reports a 110 MB log file about 90% full3 

强制一个检查点(CHECKPOINT),再次检查日志使用率。

复制代码
1 CHECKPOINT
2 GO
3 
4 DBCC SQLPERF(LOGSPACE) ;
5 -- DBCC SQLPERF reports a 100 MB log file about 60% full
复制代码

注意日志文件近乎一样的大小,但是现在只有61.9%满;日志已被截断,空间可以被重用。虽然数据库被指定为完整恢复模式,实际上这个不应该操作直到第一次完整备份发生后。很有意思,这表示我们可以通过强制检查点(CHECKPOINT),而不是运行TestDB数据库的完整备份。完整备份操作操作触发了检查点(CHECKPOINT),且日志被截断。

为了确定数据库运行在哪个模式里,执行下列查询:

复制代码
1 SELECT   db_name(database_id) AS 'DatabaseName' ,
2          last_log_backup_lsn
3 FROM     master.sys.database_recovery_status
4 WHERE    database_id = db_id('TestDB') ;
5 GO
复制代码

如果NULL值出现在last_log_backup_lsn列里,那么数据库实际上运行在自动截断模式,因此当数据库检查点发生时会截断。已经进行了完整数据库备份,你会发现那列会填上备份操作记录的日志记录的LSN,在这时,数据库菜真正运行在完整恢复模式。从这一刻开始,完整数据库备份不会在事务日志上影响;唯一截断日志的方法是备份日志。

切换模式

如果你曾从完整或大容量日志模式切换到简单模式,这会中断日志链,你只能恢复数据库到在你切换前,上一次日志备份的时间点。因此,不建议在切换前马上进行日志备份。如果你马上从简单模式切换到完整或大容量日志模式,记住数据库实际上会继续运行在自动截断模式(刚才显示的NULL值),直到你进行了另一个完整备份。

如果你从完整切换到大容量日志,那这不会中断日志链。但是在大容量模式里发生的任何大容量操作不会在事务日志里完整记录,因此不能在操作上控制,同样的方法里完整记录可以。这表示恢复数据到包含大容量操作事务日志里的时间点是不可能的。你只能恢复到日志文件尾。为了“重新启用”到时间点的恢复,在大容量操作完成后切换回完整模式,并立即进行一次日志备份。

备份的自动化和验证

即席数据库和事务日志备份可以通过SSMS里简单的T-SQL脚本进行。但是对于生产系统,DBA需要这些备份的自动化方法,还有验证备份的有效,可以用于还原你的数据。

这个话题的详细讲解已经不是这个系列文章的范围,但会在下面列出一些可用选项。由于SSMMS维护计划的一些问题,大多数DB会选择自己写脚本,然后用作业自动运行它们。

  • SSMS维护计划向导和设计器——SSMS内建的2个工具,允许你配置和计划一系列的核心数据库维护任务,包括完整数据库备份和事务日志备份。DBA也可以运行DBCC完整性检查,安排作业来删除老的备份文件等等。这些工具的精彩描述,还有它们的限制,可以在Brad McGhee的《Brad的SQL Server 维护计划指导手册》里找到。
  • T-SQL脚本——你可以写定制的T-SQL脚本来自动化你的备份任务。一个广为流传的维护脚本是Ola Hallengren提供的。它的脚本创建了各种存储过程,每个进行一个特定的数据库维护任务,包括备份,自动地使用SQL代理作业。Richard Waymire的SQL Server代理步步高是关于这个话题的良好信息来源。
  • Powershell/SMO脚本——比T-SQL脚本更强大,更通用,但对大多数DBA来说学习曲度更陡峭。Powershell可以用作脚本,自动化几乎任何的维护任务。例子可以看下:https://www.simple-talk.com/author/allen-white/
  • 第3方备份工具——很多现存的第三方工具可以自动化备份,也可以验证和监控它们。大多数提供备份压缩和加密等功能让备份管理更加简单。例子包括Red Gate的SQL Backup,Quest的LiteSpeed等等。

本文转自Woodytu博客园博客,原文链接:http://www.cnblogs.com/woodytu/p/4891544.html,如需转载请自行联系原作者
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
3天前
|
SQL 关系型数据库 MySQL
MySQL事务日志-Undo Log工作原理分析
事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
MySQL事务日志-Undo Log工作原理分析
|
3月前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1751 14
MySQL事务日志-Redo Log工作原理分析
|
4月前
|
SQL 安全 数据库
基于SQL Server事务日志的数据库恢复技术及实战代码详解
基于事务日志的数据库恢复技术是SQL Server中一个非常强大的功能,它能够帮助数据库管理员在数据丢失或损坏的情况下,有效地恢复数据。通过定期备份数据库和事务日志,并在需要时按照正确的步骤恢复,可以最大限度地减少数据丢失的风险。需要注意的是,恢复数据是一个需要谨慎操作的过程,建议在执行恢复操作之前,详细了解相关的操作步骤和注意事项,以确保数据的安全和完整。
187 0
|
5月前
|
API C# 开发框架
WPF与Web服务集成大揭秘:手把手教你调用RESTful API,客户端与服务器端优劣对比全解析!
【8月更文挑战第31天】在现代软件开发中,WPF 和 Web 服务各具特色。WPF 以其出色的界面展示能力受到欢迎,而 Web 服务则凭借跨平台和易维护性在互联网应用中占有一席之地。本文探讨了 WPF 如何通过 HttpClient 类调用 RESTful API,并展示了基于 ASP.NET Core 的 Web 服务如何实现同样的功能。通过对比分析,揭示了两者各自的优缺点:WPF 客户端直接处理数据,减轻服务器负担,但需处理网络异常;Web 服务则能利用服务器端功能如缓存和权限验证,但可能增加服务器负载。希望本文能帮助开发者根据具体需求选择合适的技术方案。
235 0
|
5月前
|
C# Windows 监控
WPF应用跨界成长秘籍:深度揭秘如何与Windows服务完美交互,扩展功能无界限!
【8月更文挑战第31天】WPF(Windows Presentation Foundation)是 .NET 框架下的图形界面技术,具有丰富的界面设计和灵活的客户端功能。在某些场景下,WPF 应用需与 Windows 服务交互以实现后台任务处理、系统监控等功能。本文探讨了两者交互的方法,并通过示例代码展示了如何扩展 WPF 应用的功能。首先介绍了 Windows 服务的基础知识,然后阐述了创建 Windows 服务、设计通信接口及 WPF 客户端调用服务的具体步骤。通过合理的交互设计,WPF 应用可获得更强的后台处理能力和系统级操作权限,提升应用的整体性能。
135 0
|
5月前
|
数据库 Java 监控
Struts 2 日志管理化身神秘魔法师,洞察应用运行乾坤,演绎奇幻篇章!
【8月更文挑战第31天】在软件开发中,了解应用运行状况至关重要。日志管理作为 Struts 2 应用的关键组件,记录着每个动作和决策,如同监控摄像头,帮助我们迅速定位问题、分析性能和使用情况,为优化提供依据。Struts 2 支持多种日志框架(如 Log4j、Logback),便于配置日志级别、格式和输出位置。通过在 Action 类中添加日志记录,我们能在开发过程中获取详细信息,及时发现并解决问题。合理配置日志不仅有助于调试,还能分析用户行为,提升应用性能和稳定性。
67 0
|
5月前
|
SQL 安全 测试技术
【数据守护者必备】SQL数据备份与恢复策略全解析:从全量到日志备份,手把手教你确保企业信息万无一失的实战技巧!
【8月更文挑战第31天】数据库是企业核心业务数据的基石,为防止硬件故障、软件错误或人为失误导致的数据丢失,制定可靠的备份与恢复策略至关重要。本文通过一个在线购物平台的案例,详细介绍了使用 SQL Server 进行全量备份、差异备份及事务日志备份的方法,并演示了如何利用 SQL Server Agent 实现自动化备份任务。此外,还提供了数据恢复的具体步骤和测试建议,确保数据安全与业务连续性。
239 0
|
5月前
|
存储 关系型数据库 MySQL
深入MySQL:事务日志redo log详解与实践
【8月更文挑战第24天】在MySQL的InnoDB存储引擎中,为确保事务的持久性和数据一致性,采用了redo log(重做日志)机制。redo log记录了所有数据修改,在系统崩溃后可通过它恢复未完成的事务。它由内存中的redo log buffer和磁盘上的redo log file组成。事务修改先写入buffer,再异步刷新至磁盘,最后提交事务。若系统崩溃,InnoDB通过redo log重放已提交事务并利用undo log回滚未提交事务,确保数据完整。理解redo log工作流程有助于优化数据库性能和确保数据安全。
695 0
|
2月前
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
472 30
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
25天前
|
监控 安全 Apache
什么是Apache日志?为什么Apache日志分析很重要?
Apache是全球广泛使用的Web服务器软件,支持超过30%的活跃网站。它通过接收和处理HTTP请求,与后端服务器通信,返回响应并记录日志,确保网页请求的快速准确处理。Apache日志分为访问日志和错误日志,对提升用户体验、保障安全及优化性能至关重要。EventLog Analyzer等工具可有效管理和分析这些日志,增强Web服务的安全性和可靠性。