第三篇——第二部分——第一文 SQL Server镜像简介

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,独享型 2核4GB
日志服务 SLS,月写入数据量 50GB 1个月
简介: 原文: 第三篇——第二部分——第一文 SQL Server镜像简介 原文出处:http://blog.csdn.net/dba_huangzj/article/details/26951563  镜像是什么?说白了就是个镜子(没用过镜子?没镜子你总要小便吧?开个玩笑。
原文: 第三篇——第二部分——第一文 SQL Server镜像简介

原文出处:http://blog.csdn.net/dba_huangzj/article/details/26951563

  镜像是什么?说白了就是个镜子(没用过镜子?没镜子你总要小便吧?开个玩笑。。偷笑 ),这里镜子的含义主要有两个:1、一模一样,下面会详细介绍,包括库名、数据文件和日志文件的存放路径都要一样。2、看得到,却“用不了”,镜像库在没有做任何处理时是不可访问的。下面进入专业一点的解释:

  数据库镜像(SQL Server Mirroring)从SQL Server 2005  SP2开始引入,虽然从2008开始被列为“将会被弃用”的功能,但是由于其有很多优势,一直被广泛使用至今。本文将介绍镜像的基础,也会介绍和其他SQL Server提供的高可用方案的对比。《SQL Server扫盲》系列将会单独介绍各种高可用方案,所以这里不会过多介绍,主要是进行对比。

 

术语:

本系列将会用到很多镜像甚至高可用的术语,所以这里先介绍相关概念:

  • 主体服务器,Principal:在镜像环境中,包含活动库的源服务器,可以理解为主服务器。
  • 镜像服务器,Mirror:在镜像环境中,包含目标数据库的服务器,即镜像环境中的目标服务器。
  • 见证服务器,Witness:可选的一个服务器,用于监控主体服务器和镜像服务器,最主要的作用是进行自动故障转移(automatic Failover)。
  • 伙伴服务器,Partner:相对于镜像环境而言,镜像服务器就是主体服务器的伙伴服务器,而主体服务器也是镜像服务器的伙伴服务器。
  • 端点,Endpoint:绑定到网络协议中的对象,允许SQL Server通过端点在网络间交互。
  • 会话,Session:活动于镜像环境中,用于维护服务器之间的状态信息和关系。简单来说就是镜像环境中各个伙伴服务器之间信息的传递者。
  • 运行模式,Operating Mode:表示镜像环境的安全级别,镜像的运行模式有三种:带有自动故障转移的高安全性模式(带有见证服务器的同步模式),不带有自动故障转移的高安全性模式(没有见证服务器的同步模式),高性能模式(没有见证服务器的异步同步)。
  • 角色,Role:在镜像环境中的功能,同一时刻,一个特定的服务器只能是三种角色中的其中一种:主体、镜像或见证。

 

运行模式:

  从大层面来说,SQL Server镜像只有两种模式:高安全模式和高性能模式。两种模式的主要区别在于在事务提交后的操作。可以从图1-1中查看运行模式。

  在高性能模式下,主体服务器不需要等待镜像服务器响应即可提交事务。

  在高安全性模式,需要把事务同步到镜像并得到响应后才最终提交主体服务器的事务。

 

注意:不管使用何种模式,主体库都必须配置为完整恢复模式。

 

图1-1 SQL Server镜像运行模式

高安全模式,High-Safety Mode:

 

  这种模式是同步模式,可以细分为带有自动故障转移(即有见证服务器)的高安全模式和不带自动故障转移(即没有见证服务器)的高安全性模式。如果没有配置见证服务器,那么【带自动故障转移功能的高安全性(同步)】选项将会为灰色,即不可选。

  两者最大的区别在于是否引入见证服务器,前面提到过,见证服务器能作为仲裁,侦测主体服务器的状态,一旦见证服务器不能连接主体服务器,将把会话自动切换到镜像服务器,如果没有见证服务器,那么需要手动切换。

  在高安全模式下,事务必须在镜像库上提交,才能在主体库提交,这也意味着整套程序都必须等待镜像提交事务后才能最终提交,如果在网络情况不理想,将影响整个运行过程。高安全模式支持标准版和企业版,并且主体和镜像服务器必须是相同版本,比如不能一个是标准版,一个是企业版。

  如果需要最高级别的镜像安全性,可以使用见证服务器作为仲裁,见证服务器不是必须的,但是却是自动Failover(故障转移)功能必须的。见证服务器可以使用Workgroup(工作组版)或者Express版。

  见证服务器用于检查镜像环境中,主体库和镜像库的联接是否正常。见证服务器并不实际执行Failover,仅仅是告知镜像服务器:“主体服务器宕机了”。即使见证服务器也宕机了,仅仅是不能自动Failover而已,不影响镜像环境。可以把见证服务器理解为,仅用于回答:主体服务器是否已经宕机了?图1-2 是带有见证服务器的高安全性模式的示意图

 

 

图1-2 带有见证服务器的高安全性模式

  当出现性能问题的时候,可以根据图1-2的步骤来一步一步侦测。

高性能模式,High-Performance Mode:

 

  这种模式是异步模式,只能手动Failover,所以没有必要设置见证服务器(实际上是可以设置,但是没有任何意义。)。这种模式会有数据丢失的可能。和高安全性模式相比,这种模式不需要等待镜像服务器的确认,所以在网络条件不理想的环境下,是不错的选择。图1-3是高性能运行模式的示意图。

图1-3  高性能运行模式

 

同步、异步处理:

 

  从图1-1 中可以看到,三种运行模式又可以分为两类处理,同步和异步。当镜像运行在同步模式下时,数据库的SAFETY选项为FULL。当镜像为异步时,数据库SAFETY的选项为OFF。两种高安全模式均为同步模式,高性能模式使用异步处理。表1-1 列出了两种模式的主要特点:

表1-1 同步和异步模式的特点:

模式

版本要求

数据丢失

SAFETY选项

性能影响

恢复速度

故障转移

同步

标准/企业

0丢失

FULL

网络可能影响性能

可自动

异步

企业版

有可能丢失数据

OFF

影响较小

根据需要提交的事务量而定

不可自动

 图1-4 SQL Server镜像运行模式选择

                SQL Server镜像的运行模式及其重要,直接影响到配置、预算及故障侦测和性能优化。需要在前期做好评估,并且选择满足当前SLA要求的模式。

会话:

 

  在配置完数据库镜像之后,就可以开始镜像会话。在镜像环境的所有服务器交互过程中,都通过会话来维护对方的状态信息。开始会话本质上就是开始主体数据库和镜像数据库的同步进程。

暂停和恢复会话:

 

  当服务器出现性能问题时,暂停数据库会话可以临时停止因为镜像带来的压力,但是要注意,暂停会话会导致日志依旧活动,并且无法截断,如果时间持续太久,会引起日志文件的迅速增长,带来一系列的性能问题。日志相关问题可以查看《SQL Server扫盲》中关于日志备份的文章。地址:http://blog.csdn.net/dba_huangzj/article/details/26844859

SSMS暂停会话:

  可以通过图1-5中的方式暂时镜像会话

 

图1-5 暂停会话

T-SQL暂停、恢复会话:

  可在主体库或者镜像库上执行下面的脚本暂停和恢复会话:

ALTER DATABASE AdventureWorks2008R2 SET PARTNER SUSPEND;--暂停会话

ALTER DATABASE AdventureWorks2008R2 SET PARTNER RESUME;--恢复会话

  当数据库镜像会话启动后,主体服务器会发送事务给镜像服务器,所有未发送到镜像服务器的事务都被收集到发送队列(send queue)。在高安全性模式下,仅在镜像库处于暂停状态时才会建立send queue。如果是高性能模式,不仅镜像处于暂停,即使服务器处于高使用率、网络慢、镜像服务器上有一个大型redo 队列或者其他原因都会引起send queue。

  在镜像库中,已经传送过来但是未被写入镜像库的事务日志的事务会存放到redo queue中。如果redo操作失败,镜像服务器会暂停会话直到问题解决。

  关于队列的介绍,将会在本系列的第六篇《监控和优化SQL Server镜像》中介绍。http://blog.csdn.net/dba_huangzj/article/details/26846203

  注意:一个数据库只能有一个镜像库,如果需要保持多个副本,可以借助日志传送加镜像。

镜像状态: 

SQL Server镜像状态可能包含下面几种:

  • SYNCHRONIZING:正在同步,通常在第一次启用数据库镜像时出现,表示镜像服务器正在追上主体服务器的进度。
  • SYNCHRONIZED:已经同步完毕,大部分时间都是这种状态,一旦有爆发性的事务传输到镜像数据库,状态会从SYNCHRONIZED转变成SYNCHRONIZING。在高安全性模式下,这种状态通常不会导致数据丢失,仅表示镜像服务器正在同步,但是在高性能模式下,可能有数据丢失的风险。
  • SUSPENDED:挂起,当主体服务器不发送事务到镜像服务器时出现,在Failover发生后会出现这种状态(如果镜像环境依旧运行,仅使用Failover则不出现,但是如果镜像库断开连接,则会出现)。手动暂停镜像会话或者redo 日志发生错误时都会出现。
  • PENDING_FAILOVER:仅当主体服务器变成镜像服务器并且断开用户连接时,会在原主体服务器出现这种状态。在这种状态下,主体服务器和镜像服务器都会表现这种状态。但是见证服务器会出现:CONNECTED/DISCONNECTED/UNKNOWN的其中一种状态。
    • CONNECTED:代表见证服务器能连到其中一个伙伴,另外两种代表不能连到伙伴服务器,这种情况下,数据库会变成不可用,如果镜像环境使用了见证,而镜像服务器为DISCONNECTED,并且镜像服务器奔溃,那么数据库(即使在主体服务器上)都会变得无法访问。所以当见证为disconnected,可以关闭见证,从而禁用仲裁,使用ALTER DATABASE <DB> SET WITNESS OFF实现。
    • DISCONNECTED:当镜像环境中的伙伴均无法连接对方时出现。

  可以使用sys.database_mirroring目录视图查看镜像信息。

切换角色:

 

相比其他高可用,镜像可以轻易切换角色,SQL Server镜像可以使用下面三种方式切换角色:

手动Failover:

使用T-SQL语句:

Use master
go
ALTER DATABASE <DB> SET PARTNER FAILOVER--在主体服务器上执行

使用SSMS:

 

图1-6使用SSMS实现手动Failover

注意:高性能模式下不支持手动切换

自动Failover:

带有见证服务器的高安全模式,当主体连接失败或者停止工作时,会自动切换到镜像服务器。当原主体服务器重新连机时,这台原主体服务器会变成镜像环境中的镜像服务器。

可能丢失数据的强制切换:

这种切换方式支持没有见证服务器的高性能和高安全模式,可以使用下面的T-SQL语句实现:

ALTER DATABASE <DB> SET PARTNER FORCE_SERVICE_ALLOW_DATA_LOSS --在镜像库执行

透明客户端重定向 :

由SQL Native Client(SNAC)提供,允许镜像环境下,应用程序自动重定向到镜像数据库中。通过在连接字符串加上Failover_Partner关键字来实现。应用程序需要添加重新尝试联接的功能。 

SQL Server2008镜像的改进:

日志流压缩:

基于最小化网络带宽带来的影响,2008引入了日志流压缩功能,但是需要注意压缩和解压功能天生就会增加CPU的开销。

自动页还原:

在过去,页损坏是很头痛的事情,并且很难恢复。2008的镜像功能通过把镜像库的对应页恢复到主体库的页上,从而恢复数据。但是有些页镜像是不能回复的,比如文件头(page 0),数据库启动页(boot page,page 9),SGAM、PFS。但是对于下面的情况,镜像可以恢复:

  • Error 823:OScyclic redundancy check(CRC)failure
  • Error 824:logical errors including a bad page checksum or torn write
  • Error 829:page has been marked as restore pending

SQL Server镜像各功能所需版本:

  一图抵千言,图1-7展示了SQL Server镜像中各个功能所需的版本支持:

 

图1-7 SQL Server镜像中各个功能所需的版本支持

其他高可用对比

截至SQL Server 2012为止,内置的高可用功能有集群(Cluster)、镜像(Mirroring)、复制(Replication)、日志传送(Log Shipping)和AlwaysOn(2012出现)。其中AlwaysOn基本上已经实现了集群、镜像的组合功能,所以本文不把镜像和AlwaysOn比较。仅对其他部分比较。详细信息可以看官方文档:

http://msdn.microsoft.com/zh-cn/library/ms190202(v=sql.105).aspx

下面简要介绍一下镜像和其他部分的对比:

集群(Cluster)

优点:
  • 这部分特指2012之前的Cluster,它基于Windows 的故障转移集群,可以自动检测SQL Server的健康状态,进行自动故障转移切换(自动Failover)。并且它的切换时间几乎等于SQL Server服务启动时间,除非有大量事务需要redo,否则一般不会延时很久,和带有见证服务器的高安全运行模式一起被称为2012之前的0延时高可用技术。另外两种都不能实现自动切换及0延时。
  • 通过虚拟网络名称,客户端可以透明访问活动实例,而不用修改程序的连接字符串,这一点比镜像有进一步的改进,镜像由于只有一个镜像库,所以在第一次Failover成功之后,如果不做处理,镜像环境中原主体库即使重新联机。
  • 从2008开始可以指定对非活跃节点进行升级维护。
缺点:
  • 使用共享磁盘,如果共享磁盘出问题,整个Cluster都会瘫痪。
  • 非活跃节点一直处于停止状态,不能分摊负载,也造成资源浪费。
  • 实施成本高,需要最少3台机且必须在域中。
  • 故障转移是整个实例的,和镜像不同,如果只有某个或者少数几个库出现问题需要Failover,镜像可以进行单独转移,但是Cluster不可以,这样会导致少数不相关的库受牵连。

  Cluster有译成群集,不过这个无所谓,大家知道这个意思即可。我个人偏向使用英文。

复制(Replication)

  复制天生就不是一种高可用技术,实际上是用来进行数据同步而已。如果单纯进行高可用方案,复制不是一个首选方案。

优点:
  • 实现对象级别的同步,可以细化到列和行。
  • 订阅库(也就是复制环境下的目标库)是可读的,可以进行读写分离方案。
  • 支持多个库订阅一个库。延时可以达到秒级。
  • 可以使用不同的SQL Server版本。
缺点:
  • 不提供自动故障转移。
  • 不保证对象0丢失。
  • 故障侦测较为困难,错误信息往往不能很明显地表现出问题。
  • 对表的定义有一定限制,比如事务复制要求表必须有主键。

日志传送(Log Shipping)

优点:
  • 目标库可作为报表使用。并且过程中对主体服务器的压力很小。
  • 支持冗余多个副本,可进行远程暖备。
  • 机制简单,故障侦测较为容易。
缺点:
  • 不支持不同版本的SQL Server。
  • 延时是一定有的,不能实现完全同步。
  • 不支持自动侦测和转移。
  • 还原日志时,目标库不能对外访问。
  • 同步以库为单位。

 

  下面借用《SQL Server 2012 实施与管理实战指南》上的一个表格来总结一下:

功能

Cluster

日志传送

镜像

复制

保护级别

实例

数据库对象

数据丢失

/

可能

同步模式下无

可能有

自动故障转移

高安全模式下是

对客户端是否透明

是,但需要设置字符串

停机时间

基于服务重启

等于恢复时间

多备用库

备用副本可读

/

抵御误操作

抵御磁盘故障

是否需要特定硬件

Windows集群

要求较好的磁盘和网络

对性能影响

版本支持

2000开始

2000开始

2005开始

2000开始

下一篇:第三篇——第二部分——第二文 计划搭建SQL Server镜像 
相关实践学习
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
25天前
|
SQL IDE Java
Java连接SQL Server数据库的详细操作流程
Java连接SQL Server数据库的详细操作流程
|
1月前
|
SQL DataWorks NoSQL
DataWorks产品使用合集之如何将SQL Server中的数据转存到MongoDB
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
252 1
|
2月前
|
SQL API 流计算
实时计算 Flink版产品使用合集之在Mac M1下的Docker环境中开启SQL Server代理的操作步骤是什么
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
174 1
|
3天前
|
SQL 存储 数据库
SQL简介
【7月更文挑战第10天】SQL简介。
8 2
|
3天前
|
SQL 存储 安全
数据库数据恢复—SQL Server数据库出现逻辑错误的数据恢复案例
SQL Server数据库数据恢复环境: 某品牌服务器存储中有两组raid5磁盘阵列。操作系统层面跑着SQL Server数据库,SQL Server数据库存放在D盘分区中。 SQL Server数据库故障: 存放SQL Server数据库的D盘分区容量不足,管理员在E盘中生成了一个.ndf的文件并且将数据库路径指向E盘继续使用。数据库继续运行一段时间后出现故障并报错,连接失效,SqlServer数据库无法附加查询。管理员多次尝试恢复数据库数据但是没有成功。
|
9天前
|
SQL 存储 关系型数据库
关系型数据库SQL Server学习
【7月更文挑战第4天】
21 2
|
13天前
|
SQL 存储 测试技术
|
12天前
|
SQL 机器学习/深度学习 搜索推荐
SQL SERVER 转换失败
【6月更文挑战第25天】
|
17天前
|
SQL 关系型数据库 分布式数据库
PolarDB产品使用问题之如何迁移SQL Server
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
26天前
|
SQL 存储 关系型数据库
关系型数据库中的SQL Server
【6月更文挑战第11天】
55 3