开发者社区> 问答> 正文

谁说阿里云不能跑Oracle,让驻云架构师告诉你怎么办!


   私网高可用虚拟IP(Private High-Availability Virtual IP Address,简称HaVip),是一种可以独立创建和释放的私网IP资源。这种私网IP的特殊之处在于,用户可以在ECS上使用协议进行该IP的宣告。

  1. 一个HaVip对象可以与最多两台ECS实例进行绑定;绑定了的实例可以通过ARP方式进行该私网IP的宣告。
  2. 一台ECS实例可以在持有一个普通私网IP的情况下,可以宣告多个HaVip类型的私网IP,从而同时持有多个私网IP。
  3. 利用可在ECS进行私网IP宣告的功能,可以 实现基于VRRP协议的高可用方案,包括keepalived、heartbeat等成熟的开源方案。
  4. HaVip可以与EIP进行绑定,从而实现HaVip在ECS实例间切换时,发向EIP的消息也被重定向到新的ECS实例上。
  5. HaVip仅支持VPC网络环境。Classic网络环境下不提供HaVip功能。
文字多了理解起来困难,直接看图。

· 关于阿里云的Oracle的高可用
   有着Oracle背景的DBA们都知道,Oracle的高可用集群是Real Application Cluster(RAC),但是搭建RAC集群需要几个硬性条网络通讯模式得是广播
  1. 网络通讯模式得是广播
  2. 必须有两个网络分别用于心跳链路与公网服务
  3. 共享存储 (可以使用NFS挂载来解决)

    这网络广播模式在阿里云上就无法跳过,更不用说VPC环境下只能有一个网卡地址,只能考虑使用其他的方案来解决OracleDB的高可用环境。
    有过阿里云RDS经验的同学都知道,RDS的高可用是通过主备库的服务切换来实现的,当主库损坏的情况下,备库会在很短时间内接管服务,其代价就是在切换过程中session会断开造成短时间的数据库服务中断,大概在30秒左右。而我们在阿里云上实现Oracle高可用也是类似这种方式实现。
    言归正传,接下来我们说说如何在阿里云上部署这套高可用方案。

传统方式下的Dataguard架构如下图:

一般是由有两台ECS,IP地址分别为10.10.1.2,与10.10.1.3,这两台ECS上部署着一套Oracle PRIMARY-STANDBY环境,这套Dataguard方案使用Oracle dgbroker管理,当PRIMARY库崩溃的时候,Standby会主动的接管服务,但是这里大家都知道,Oracle database的访问是需要通过listener的,我们两台ECS默认的IP地址是不同的,这样当standby接管服务后,application的数据库连接池要把IP改为10.10.1.3才能再次连接数据库服务,大家都知道,连接池地址的改动是要重启容器,如果application都需要重启,就完全不能称做高可用了,很庆幸,阿里云提供了一个叫做havip的服务。
我们来看看下面这幅图

  1. 如果ECS服务不终止,数据库角色做切换,havip如何漂移?
  2. 如果ECS服务强制停止了,Havip如何漂移到备用环境?
    要解决这两个问题,我们就要用到我们的keepalived了,具体的实现思路,我们来看看。

·  实现思路
   1:首先我们先创建一套Dataguard环境,为了保证切换后连接池无需改动,两台ECS上的DB的sid必须一致。

这里我们假设两个场景,keepalived启动后。


     1、10.10.1.2使用了master(primary)配置文件,10.10.1.3使用了backup(standby)配置文件。当primary db与standby db互换了角色,而这时候havip依然是与master也就是10.10.1.2这台绑定。

     2、10.10.1.2使用了master(primary)配置文件,10.10.1.3使用了backup(standby)配置文件。我们强制关闭了10.10.1.2这台ECS,这时候havip漂移到了backup机器上,standby db也变成了primary角色,当我们再次启动10.10.1.2这台ECS后,havip又会飘回master配置文件所在的ECS,这时候数据库服务又无法通过havip访问了。

    这里该如何去解决这个问题呢?面对上面的两个场景,我们取了个巧。
  注意配置文件中的这两段

    说到这,大家是不是很想看看shell的代码~
    首先我们看看master的检查逻辑
mcheckdb.sh

很简单的逻辑,切换到oracle用户执行一个dbrole.sh,这个shell会执行Oracle db的角色查询,然后把结果写在/etc/keepalived/oracle/dbrole这个文件中。如果结果不是’PRIMARY’就把/etc/keepalived/samples/backup.keepalived.conf 文件内容替换掉当前keepalived进程使用的配置文件,然后再重启keepalived 服务。到这儿,大家应该知道如何做了吧。
scheckdb.sh

scheckdb.sh的内容大同小异样,不过多了一步,打开监听listener2,这listener2,就是开启HAVIP的监听地址。

    我们可以在两台ECS上都准备好master与backup 两份配置文件,这样不但解决了上面两个场景的问题,还直接让havip可以根据数据库的角色做漂移,保证在dataguard可用的前提下,时刻漂移在我们的primary database。

    最后,给大家提供一些代码与一个小工具。
Keepalived 的各种配置文件:

下载地址:http://jiagouyun-cn.oss-cn-hangzhou.aliyuncs.com/oracle/keepalived/keepalived.zip

    解压后把整个keepallived 目录直接放到/etc下,注意其中有个oracle目录,包括其中的文件必须改成oracle用户的权限。

    再提供提供一个配置DG的shell工具,大家没事可以用用,脚本有针对性,仅用于学习不建议配置生产环境时使用。

下载地址:http://jiagouyun-cn.oss-cn-hangzhou.aliyuncs.com/oracle/dataguard.1.3.zip

展开
收起
驻云科技 2016-03-10 15:01:31 16674 0
4 条回答
写回答
取消 提交回答
  • Re谁说阿里云不能跑Oracle,让驻云架构师告诉你怎么办!
    貌似只提到了VIP

    这个是重点吗?

    数据的高可用怎么体现?
    2016-05-04 13:36:34
    赞同 展开评论 打赏
  • Re谁说阿里云不能跑Oracle,让驻云架构师告诉你怎么办!
    能不能把照片删掉~~,肖像权啊!!
    2016-03-17 14:00:56
    赞同 展开评论 打赏
  • 上海驻云信息科技有限公司成立于2013年,是一家领先的企业云计算架构咨询、实施、管理及运维技术服务提供商,致力于为企业客户提供卓越的云计算整体解决方案。
    回 1楼怀英的帖子
    嘻嘻嘻   有技术干货的话会持续更新的~
    2016-03-16 14:07:09
    赞同 展开评论 打赏
  • 阿里云ping https://ping.gaomeluo.com/aliyun/
    你懂的!
    2016-03-10 21:22:46
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云云原生Serverless产品手册 立即下载
阿里云认证的解析与实战-云计算ACP认证 立即下载
阿里云认证的解析与实战-数据仓库ACP认证 立即下载

相关镜像