Oracle RAC FailOver配置

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
简介:

   Oracle RAC主要为数据库的应用提供了HA(High Available)的环境,HA体现在负载均衡(loadbalance)和容错(failover)两个方面。

Oracle RAC 的Failover 可以分为2种:

1. TAF(Client_side)

2. Service-Side TAF

一. TAF(Transparent Application Failover)

参考:

10g & 11g Configuration of TAF(Transparent Application Failover) and Load Balancing [ID 453293.1]

    所谓TAF,就是连接建立以后,应用系统运行过程中,如果某个实例发生故障,连接到这个实例上的用户会被自动迁移到其他的健康实例上。对于应用程序而言,这个迁移过程是透明的,不需要用户的介入,当然,这种透明要是有引导的,因为用户的未提交事务会回滚。 相对与Client-Side Connect Time Failover的用户程序中断,抛出连接错误,用户必须重启应用程序,TAF 这种方式在提高HA上有了很大的进步。

TAF 的配置也很简单,只需要在客户端的tnsnames.ora中添加FAILOVER_MODE配置项。这个条目有4个子项目需要定义。

1. METHOD: 用户定义何时创建到其实例的连接,有BASIC 和 PRECONNECT 两种可选值。 

       BASIC: 是指在感知到节点故障时才创建到其他实例的连接。(时间换资源)

       PRECONNECT: 是在最初建立连接时就同时建立到所有实例的连接,当发生故障时,立刻就可以切换到其他链路上。(资源换时间)

两种方法比较: BASIC方式在Failover时会有时间延迟,PRECONNECT方式虽然没有时间延迟,但是建立多个冗余连接会消耗更多资源,两者就是是用时间换资源和用资源换时间的区别。

2. TYPE: 用于定义发生故障时对完成的SQL 语句如何处理,其中有2种类型:session 和select.

这2种方式对于未提交的事务都会自动回滚,区别在于对select 语句的处理,对于select,用户正在执行的select语句会被转移到新的实例上,在新的节点上继续返回后续结果集,而已经返回的记录集则抛弃。

假设用户正在节点1上执行查询,整个结果集共有1000条记录,现在已从节点1上返回100条记录,这时节点1宕机,用户连接被转移到节点2上,如果是session模式,则需要重新执行查询语句;如果是select方式,会从节点2上继续返回剩下的900条记录,而已经从节点1返回的100条记录不会重复返回给用户,对于用户而言,感受不到这种切换。

显然为了实现select 方式,Oracle 必须为每个session保存更多的内容,包括游标,用户上下文等,需要更多的资源也是用资源换时间的方案。

3. DELAY 和 RETRIES: 这2个参数分别代表重试间隔时间和重试次数


案例1:

tnsnames.ora: (METHOD = basic)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
PROD =
   (DESCRIPTION =
     (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.8.13)(PORT = 1521))
     (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.8.14)(PORT = 1521))
     (LOAD_BALANCE = yes)
     (CONNECT_DATA =
       (SERVER = DEDICATED)
       (SERVICE_NAME = prod)
       (FAILOVER_MODE =
         (TYPE = session)
         (METHOD = basic)
         (RETRIES = 180)
         (DELAY = 5)
       )
     )
   )

  客户端连接测试:

wKiom1OZaRXRMcE4AANb2PSvQx0775.jpg


将Instance 1  shutdown

[oracle@node1 ~]$ srvctl stop instance -d prod -i prod1

验证客户端failover:

wKiom1OZalDiWvFtAACvvJ_OPu4384.jpg

执行查询出现错误,再次执行查询成功

wKioL1OZak-A8d4zAAHRk5I5OC4453.jpg


现在session切换到instance 2.

案例2:

tnsnames.ora: (METHOD = preconnect)


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
PROD_RAC1 =
   (DESCRIPTION =
     (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.8.13)(PORT = 1521))
     (LOAD_BALANCE = yes)
     (CONNECT_DATA =
       (SERVER = DEDICATED)
       (SERVICE_NAME = prod)
       (FAILOVER_MODE =
         (TYPE = select)
         (METHOD = preconnect)
         (BACKUP = PROD_RAC2) 
       )
     )
   )
PROD_RAC2 =
   (DESCRIPTION =
     (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.8.14)(PORT = 1521))
     (LOAD_BALANCE = yes)
     (CONNECT_DATA =
       (SERVER = DEDICATED)
       (SERVICE_NAME = prod)
       (FAILOVER_MODE =
         (TYPE = select)
         (METHOD = preconnect)
         (BACKUP = PROD_RAC1)    
       )
     )
   )

 客户端连接测试:

wKiom1OZbgSQ8q_bAAPAJ4jrf2Y782.jpg


将Instance 1shutdown

[oracle@node1 ~]$ srvctl stop instance -d prod -i prod1

验证客户端failover:

wKioL1OZbmuD29lzAAIHBbnQdfs423.jpg


在客户端切换到新的节点时,实现了无缝切换!

二、Service-Side TAF

Service-Side TAF的配置参考:

  How To Configure Server Side Transparent Application Failover [ID 460982.1]

     Service-SideTAF 可以看作是TAF的一种变种,首先Service-SideTAF也是TAF,所有TAF的特点它都有,其次这种TAF是在服务器上配置的,而不像TAF是在客户端配置的。

Client-Side TAF 是在客户端修改tnsnames.ora 文件来配置的,如果有很多客户端使用这个数据库,那么每次微笑调整都需要把所有的计算机更改一遍,既低效又容易出错。而Service-Side TAF 通过结合Service,在数据库里保存FAIL_MODE的配置,把所有的TAF配置保存在数据字典中,从而省去了客户端的配置工作,现在客户端的TNS文件就不需要任何TAF的配置选项了。

    从配置参数而言,Service-Side TAF和TAF 相比多了一个Instance Role(实例角色)的概念。 所谓的实例角色,就是当有多个Instance 参与一个Service时,可以配置优先使用哪一个Instance为用户提供服务。用户共有两种可选角色。

PREFERRED:首选实例,会优先选择拥有这个角色的实例提供服务。

AVAILABLE: 后备实例,用户连接会优先连接PREFFERRED的Instance,当PREFERRED的Instance不可用时,才会被转到AVAILBALE的Instance上。

要使用Server-Side TAF必须配置Service。 Service 可以在创建数据库时创建,也可以在创建数据库之后修改,既可以使用dbca 配置向导,也可以用命令行的 方式配置。

用srvctl 命令配置Service:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
[oracle@node1 ~]$ srvctl add service -h
Adds a service configuration to the Oracle Clusterware.
Usage: srvctl add service -d <db_unique_name> -s <service_name> {-r  "<preferred_list>"  [-a  "<available_list>" ] [-P {BASIC | NONE | PRECONNECT}] | -g <server_pool> [-c {UNIFORM | SINGLETON}] } [-k   <net_num>] [-l [PRIMARY][,PHYSICAL_STANDBY][,LOGICAL_STANDBY][,SNAPSHOT_STANDBY]] [-y {AUTOMATIC | MANUAL}] [-q {TRUE|FALSE}] [-x {TRUE|FALSE}] [-j {SHORT|LONG}] [-B {NONE|SERVICE_TIME|THROUGHPUT}] [-e {NONE|SESSION|SELECT}] [-m {NONE|BASIC}] [-z <failover_retries>] [-w <failover_delay>]
     -d <db_unique_name>      Unique name  for  the database
     -s <service>             Service name
     -r  "<preferred_list>"     Comma separated list of preferred instances
     -a  "<available_list>"     Comma separated list of available instances
     -g <pool_name>          Server pool name
     -c {UNIFORM | SINGLETON} Service runs  on  every active server  in  the server pool hosting  this  service (UNIFORM)  or  just one server (SINGLETON)
     -k <net_num>             VIP network number (default number is  1 )
     -P {NONE | BASIC | PRECONNECT}        TAF policy specification
     -l <role>                Role of the service (primary, physical_standby, logical_standby, snapshot_standby)
     -y <policy>              Management policy  for  the service (AUTOMATIC  or  MANUAL)
     -e <Failover type>       Failover type (NONE, SESSION,  or  SELECT)
     -m <Failover method>     Failover method (NONE  or  BASIC)
     -w <integer>             Failover delay
     -z <integer>             Failover retries
     -j <clb_goal>  Connection Load Balancing Goal (SHORT  or  LONG). Default is LONG.
     -B <Runtime Load Balancing Goal>     Runtime Load Balancing Goal (SERVICE_TIME, THROUGHPUT,  or  NONE)
     -x <Distributed Transaction Processing>  Distributed Transaction Processing (TRUE  or  FALSE)
     -q <AQ HA notifications> AQ HA notifications (TRUE  or  FALSE)
Usage: srvctl add service -d <db_unique_name> -s <service_name> -u {-r  "<new_pref_inst>"  | -a  "<new_avail_inst>" }
     -d <db_unique_name>      Unique name  for  the database
     -s <service>             Service name
     -u                       Add a  new  instance to service configuration
     -r <new_pref_inst>       Name of  new  preferred instance
     -a <new_avail_inst>      Name of  new  available instance
     -h                       Print usage
[oracle@node1 ~]$

案例3:

[oracle@node1 ~]$ srvctl add  service -d prod -s TAF -r "prod1,prod2" -P BASIC

[oracle@node1 ~]$ srvctl start service -d prod -s TAF

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
[oracle@node1 ~]$  srvctl config service -d prod -a
Service name: TAF
Service is enabled
Server pool: prod_TAF
Cardinality: 2
Disconnect:  false
Service role: PRIMARY
Management policy: AUTOMATIC
DTP transaction:  false
AQ HA notifications:  false
Failover type: NONE
Failover method: NONE
TAF failover retries: 0
TAF failover delay: 0
Connection Load Balancing Goal: LONG
Runtime Load Balancing Goal: NONE
TAF policy specification: BASIC
Preferred instances: prod1,prod2
Available instances:

修改service需要使用dbms_service:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
16:39:31 SYS@ prod1>begin
16:39:34   2  dbms_service.modify_service(
16:39:57   3  service_name=> 'TAF' ,
16:40:07   4  failover_method=>dbms_service.failover_method_basic,
16:40:45   5  failover_type=>dbms_service.failover_type_select,
16:41:07   6  failover_retries=>180,
16:41:26   7  failover_delay=>5);
16:41:40   8  end;
16:41:45   9  /
PL/SQL procedure successfully completed.
 
Elapsed: 00:00:00.06
16:41:46 SYS@ prod1>
 
16:43:20 SYS@ prod1>COL NAME FOR A10
16:43:28 SYS@ prod1>COL FAILOVER_METHOD FOR A20
16:43:47 SYS@ prod1>col FAILOVER_TYPE    for  a20
 
16:43:54 SYS@ prod1>r
   1  select name,failover_method,failover_type,goal,clb_goal from dba_services
   2* where name= 'TAF'
 
NAME       FAILOVER_METHOD      FAILOVER_TYPE        GOAL         CLB_G
---------- -------------------- -------------------- ------------ -----
TAF        BASIC                SELECT               NONE         LONG
 
Elapsed: 00:00:00.00
 
16:36:08 SYS@ prod1>show parameter name
 
NAME                                 TYPE        VALUE
------------------------------------ ----------- ------------------------------
db_file_name_convert                 string
db_name                              string      prod
db_unique_name                       string      prod
global_names                         boolean     FALSE
instance_name                        string      prod1
lock_name_space                      string
log_file_name_convert                string
service_names                        string      TAF

客户端验证:

tnsnames.ora:

1
2
3
4
5
6
7
8
9
10
11
TAF =
   (DESCRIPTION =
     (ADDRESS_LIST =
       (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.8.13)(PORT = 1521))
        (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.8.14)(PORT = 1521))
     )
     (CONNECT_DATA = 
     (SERVER = DEDICATED)
       (SERVICE_NAME = taf)
     )
   )

wKioL1OZc6Dyl9qLAAJXOCN9MF8133.jpg

17:24:02 SYS@ prod2>select inst_id,sid,username from gv$session where username='SCOTT';

   INST_ID        SID USERNAME

---------- ---------- ------------------------------

         1         33 SCOTT

将Instance 1  shutdown

[oracle@node1 ~]$ srvctl stop instance -d prod -i prod1

验证客户端failover:

wKioL1OZdGyxaNfqAADccuor_pU322.jpg

17:25:01 SYS@ prod2>select inst_id,sid,username from gv$session where username='SCOTT';

   INST_ID        SID USERNAME

---------- ---------- ------------------------------

         2         59 SCOTT

         2         63 SCOTT

scott用户在instance 1被shutdown后切换到了instance 2,没有出现错误!


@至此,关于Oracle RAC FailOver的介绍就到此,欢迎批评指正!

  










本文转自 客居天涯 51CTO博客,原文链接:http://blog.51cto.com/tiany/1425456,如需转载请自行联系原作者
相关实践学习
小试牛刀,一键部署电商商城
SAE 仅需一键,极速部署一个微服务电商商城,体验 Serverless 带给您的全托管体验,一起来部署吧!
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
目录
相关文章
|
2月前
|
SQL Oracle 关系型数据库
如何在 Oracle 中配置和使用 SQL Profiles 来优化查询性能?
在 Oracle 数据库中,SQL Profiles 是优化查询性能的工具,通过提供额外统计信息帮助生成更有效的执行计划。配置和使用步骤包括:1. 启用自动 SQL 调优;2. 手动创建 SQL Profile,涉及收集、执行调优任务、查看报告及应用建议;3. 验证效果;4. 使用 `DBA_SQL_PROFILES` 视图管理 Profile。
|
6月前
|
Ubuntu Oracle 关系型数据库
Oracle VM VirtualBox之Ubuntu 22.04LTS双网卡网络模式配置
这篇文章是关于如何在Oracle VM VirtualBox中配置Ubuntu 22.04LTS虚拟机双网卡网络模式的详细指南,包括VirtualBox网络概述、双网卡网络模式的配置步骤以及Ubuntu系统网络配置。
608 3
|
7月前
|
运维 Oracle 前端开发
Oracle 11g RAC集群日常运维命令总结
Oracle 11g RAC集群日常运维命令总结
155 2
|
7月前
|
Oracle 关系型数据库
分布式锁设计问题之Oracle RAC保证多个节点写入内存Page的一致性如何解决
分布式锁设计问题之Oracle RAC保证多个节点写入内存Page的一致性如何解决
|
7月前
|
Oracle 关系型数据库 BI
ORACLE Apex: EBS多组织结构 理解与配置
【8月更文挑战第11天】在Oracle Apex中理解和配置与EBS多组织结构相关内容需掌握:1) EBS多组织结构概念及组成部分,如法律实体、业务单位与库存组织;2) Oracle Apex与EBS集成的目的与方式,包括提供友好界面及自定义业务流程;3) 在Apex中配置多组织结构应用,涉及数据访问控制、页面报表设计及业务流程集成。整体而言,需精通EBS架构与Apex开发技术,以实现高效灵活的企业解决方案。
159 2
|
8月前
|
存储 负载均衡 Oracle
|
8月前
|
存储 Oracle 关系型数据库
|
10月前
|
存储 Oracle 关系型数据库
Oracle RAC:数据库集群的舞动乐章
【4月更文挑战第19天】Oracle RAC是Oracle提供的高可用性数据库解决方案,允许多个实例共享同一数据库,确保业务连续性和数据完整性。通过集群件和全局缓存服务实现服务器间的协调和通信。RAC提供高可用性,通过故障转移应对故障,同时提升性能,多个实例并行处理请求。作为数据管理员,理解RAC的架构和管理至关重要,以发挥其在数据管理中的最大价值。

推荐镜像

更多