CentOS7+MySQL/MariaDB+Galera+HAProxy+Keepalived构建高可用数据库集群

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介:

方案优势:

Galera能够实现MySQL/MariaDB数据库的主主复制和多主复制等模式,这些复制模式都是同步进行的,同步时间非常短

每一个节点都可以同时写入和读取,当某一节点发生故障时,可自动从集群中自动剔除

HAProxy能提供负载均衡和故障判断等功能解决服务器系统存在的单点故障

Keepalived能提供客户端连接数据库时使用的虚拟IP地址(VIP)

关于HAProxy的负载均衡算法

轮询方式(roundrobin):不适合用于backend为web服务器的情况,因为session、cookie会话保持会出现轮询导致的随机切换,是处理速度最快的算法,但最大服务器数量不能超过4095

原地址方式(source):适合于backend为web服务器的情况,能够实现session、cookie会话保持

最少连接算法(leastconn):适合于服务器配置相同或者相近的情况,能最大限度的将工作负载平均分配到每一台服务器上,它适用于session较长的连接,如SQL、LDAP、TSE等,但不适合于session较短的连接,例如它不适合于http连接

权重算法(static-rr),根据服务器的权重(weights)轮流使用每一个服务器,有计划(根据权重)的去轮询,此种方式将占用较少的CPU资源,大约降低1%

除此之外还有可以根据请求的URI和请求的URI参数的uri算法和uri-param算法以及根据HTTP header内容决定是否轮询的hdr算法,还有rdp-cookie算法可以根据cookie决定请求发往那一台服务器。

测试结果

当其中的一个节点发生宕机或事故导致数据库关闭或网络中断时,haproxy的状态能及时的显示后端节点的连接状态并将错误的节点从服务器资源池中移除,当网络或宕机恢复时,只有数据库启动成功后才能使得haproxy的状态显示正常。

目前此方案已经应用于OpenStack云平台开发环境,提供active-active高可用服务。

存在或已知问题

采用MySQL/MariaDB+Galera方案的数据库集群将仅对Innodb有效,而且不再支持查询缓存

关于CentOS7 的时间同步问题,时间同步服务已经由ntpd更新为chrony,可用yum info chrony查看chrony的简介以及用man查看chrony的用法

关于CentOS7 的日志服务问题,日志服务已经由syslog更新(CentOS6开始)为journald(rsyslogd) ,其配置文件变为/etc/rsyslog.conf

在<Red Hat Enterprise Linux 7 System Administrator's Guide>手册中提到“Log files can also be managed by the journald daemon – a component of systemd . The journald daemon captures Syslog messages, kernel log messages, initial RAM disk and early boot messages as well as messages written to standard output and standard error output of all services, indexes them and makes this available to the user.”,具体参见“Chapter 18, Viewing and Managing Log Files”,以及man rsyslogd.

启用日志支持:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
#syslog-->Rsyslog-->journald   
# enable syslog for haproxy    
sed  -i  's/SYSLOGD_OPTIONS=""/SYSLOGD_OPTIONS="-r"/g'  /etc/sysconfig/rsyslog    
cat  > /etc/rsyslog .d /haproxy .conf<<eof    
# Log haproxy(local2.*) stuff    
\$ModLoad imudp    
\$UDPServerRun 514    
local2.*                                                   /var/log/haproxy .log    
eof    
chown  -R --reference= /etc/rsyslog .d /listen .conf  /etc/rsyslog .d /haproxy .conf    
chcon -R --reference= /etc/rsyslog .d /listen .conf  /etc/rsyslog .d /haproxy .conf    
systemctl restart rsyslog.service
# enable syslog for keepalived   
sed  -i  's/KEEPALIVED_OPTIONS="-D"/KEEPALIVED_OPTIONS="-D -S 0"/g'  /etc/sysconfig/keepalived    
cat  > /etc/rsyslog .d /keepalived .conf<<eof    
# Log keepalived(local0.*) stuff    
\$ModLoad imudp    
\$UDPServerRun 514    
local0.*                                                   /var/log/keepalived .log    
eof    
chown  -R --reference= /etc/rsyslog .d /listen .conf  /etc/rsyslog .d /keepalived .conf    
chcon -R --reference= /etc/rsyslog .d /listen .conf  /etc/rsyslog .d /keepalived .conf    
systemctl restart rsyslog.service

tips:

Galera的配置中第一台服务器的wsrep_cluster_address可以设置成“gcomm://”,而第二个节点的wsrep_cluster_address可以设置成“gcomm://第一个节点的IP地址”,第三个节点的wsrep_cluster_address可以设置成“gcomm://第二个节点的IP地址”,以此类推,但需要注意的是必须第n个节点先于第n+1个节点启动数据库,第n+1个数据库才能启动成功

Galera的配置中不要将gcomm://写成dumm://,dumm://仅用于测试用途

Galera的配置中wsrep_provider_options的与ssl相关的文件可以从此选项中移除掉或者将所有的节点都使用一套ssl文件,包括证书和key

HAProxy可以通过option mysql-check user dbuser检查后端服务器数据库的运行情况

HAProxy的最大连接数将决定整个集群的最大连接数,因此HAProxy的maxconn值应该设置成(后端服务器的数量*后端服务器所能承受的最大连接数*90%)*110%,其中90%和110%表示可承受负载的余量

keepalived可以采用互为主备的设计策略,关于互为主备关系的两个VIP的用途,猜测是一个VIP提供A服务,另一个VIP提供B服务,这样“解决”了其中一个节点长期处于备机状态的情况。

有时为了减少keepalived中主备之间的抢断,可以将主备设置成备备,但将其中一个备机设置成非抢断模式,这样可以防止出现master宕机恢复后的抢断情况,减少VIP的切换时间

HAProxy+keepalived的方案也可以用于http类型的传输协议,此时针对这单一情况还可以使用nginx+keepalived等负载均衡方案

附加:各个节点的配置文件:

节点1数据库配置文件

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
[root@controllernode1 ~] # delsc /etc/my.cnf.d/galera.cnf    
[mysqld]     
binlog_format=ROW     
default-storage-engine=innodb     
innodb_autoinc_lock_mode=2     
innodb_locks_unsafe_for_binlog=1     
query_cache_size=0     
query_cache_type=0     
bind-address=0.0.0.0     
wsrep_provider= /usr/lib64/galera/libgalera_smm .so     
wsrep_provider_options= "pc.wait_prim=no; pc.bootstrap=true;"     
wsrep_cluster_name= "wsrep_cluster"     
wsrep_cluster_address= "gcomm://"       
wsrep_slave_threads=1     
wsrep_certify_nonPK=1     
wsrep_max_ws_rows=131072     
wsrep_max_ws_size=1073741824     
wsrep_debug=0     
wsrep_convert_LOCK_to_trx=0     
wsrep_retry_autocommit=1     
wsrep_auto_increment_control=1     
wsrep_drupal_282555_workaround=0     
wsrep_causal_reads=0     
wsrep_notify_cmd=     
wsrep_sst_method= rsync     
wsrep_sst_auth=root:password     
[root@controllernode1 ~] #

节点2数据库配置文件

与节点1基本相同,只是wsrep_cluster_address的地址不一样。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
[root@controllernode2 ~] # delsc /etc/my.cnf.d/galera.cnf    
[mysqld]     
binlog_format=ROW     
default-storage-engine=innodb     
innodb_autoinc_lock_mode=2     
innodb_locks_unsafe_for_binlog=1     
query_cache_size=0     
query_cache_type=0     
bind-address=0.0.0.0     
wsrep_provider= /usr/lib64/galera/libgalera_smm .so     
wsrep_provider_options= "pc.wait_prim=no; pc.bootstrap=true;"     
wsrep_cluster_name= "wsrep_cluster"     
wsrep_cluster_address= "gcomm://192.168.21.11"      
wsrep_slave_threads=1     
wsrep_certify_nonPK=1     
wsrep_max_ws_rows=131072     
wsrep_max_ws_size=1073741824     
wsrep_debug=0     
wsrep_convert_LOCK_to_trx=0     
wsrep_retry_autocommit=1     
wsrep_auto_increment_control=1     
wsrep_drupal_282555_workaround=0     
wsrep_causal_reads=0     
wsrep_notify_cmd=     
wsrep_sst_method= rsync     
wsrep_sst_auth=root:wd2015     
[root@controllernode2 ~] #

节点1HAProxy配置文件

[root@networknode1 ~]# cat /etc/haproxy/haproxy.cfg    
global     
    log         127.0.0.1 local2     
    chroot      /var/lib/haproxy     
    pidfile     /var/run/haproxy.pid     
    maxconn     4000     
    user        haproxy     
    group       haproxy     
    daemon     
    stats socket /var/lib/haproxy/stats     
defaults     
    #mode                    tcp     
    mode                    http     
    option                    httplog     
    log                     global     
    option                  dontlognull     
    option                  redispatch     
    option                  tcpka     
    retries                 3     
    timeout queue           1m     
    timeout connect         10s     
    timeout client          1m     
    timeout server          1m     
    timeout check           10s     
    timeout http-keep-alive 10s     
    maxconn                 10000

listen stats    
  mode http     
  bind *:10000     
  stats enable     
  stats uri /haproxy     
  stats realm HAProxy\ Statistics     
  stats auth haproxy:password

listen mariadb    
  mode tcp     
  bind *:3306     
  balance leastconn     
  option mysql-check user haproxy     
  server controllernode1 192.168.21.11:3306 weight 1 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:3306 weight 1 check inter 2000 rise 2 fall 5

listen keystone_admin    
  mode http     
  bind *:35357     
  balance source     
  option tcpka     
  option httpchk     
  server controllernode1 192.168.21.11:35357 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:35357 check inter 2000 rise 2 fall 5

listen keystone_api    
  mode http     
  bind *:5000     
  balance source     
  option tcpka     
  option httpchk     
  server controllernode1 192.168.21.11:5000 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:5000 check inter 2000 rise 2 fall 5

listen swift_proxy_cluster    
  #mode http     
  mode tcp     
  bind *:8080     
  balance source     
  option tcpka     
  option tcplog     
  server swiftstoragenode1 192.168.21.11:8080  check inter 2000 rise 2 fall 5     
  server swiftstoragenode2 192.168.21.12:8080  check inter 2000 rise 2 fall 5

listen glance_api    
  mode http     
  bind *:9292     
  balance source     
  option tcpka     
  option httpchk     
  server controllernode1 192.168.21.11:9292 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:9292 check inter 2000 rise 2 fall 5

listen amqp_server    
  mode tcp     
  bind *:5672     
  option tcpka     
  balance source     
  server controllernode1 192.168.21.11:5672 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:5672 check inter 2000 rise 2 fall 5

listen nova_ec2    
  #mode http     
  mode tcp     
  bind *:8773     
  balance source     
  option tcpka     
  #option httpchk     
  maxconn 10000     
  server controllernode1 192.168.21.11:8773 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:8773 check inter 2000 rise 2 fall 5

listen nova_osapi    
  mode http     
  bind *:8774     
  balance source     
  option tcpka     
  option httpchk     
  maxconn 10000     
  server controllernode1 192.168.21.11:8774 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:8774 check inter 2000 rise 2 fall 5

listen nova_metadata    
  mode http     
  bind *:8775     
  balance source     
  option tcpka     
  option httpchk     
  maxconn 10000     
  server controllernode1 192.168.21.11:8775 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:8775 check inter 2000 rise 2 fall 5

listen novnc    
  mode http     
  bind *:6080     
  balance source     
  option tcpka     
  maxconn 10000     
  server controllernode1 192.168.21.11:6080 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:6080 check inter 2000 rise 2 fall 5

listen neutron_api    
  mode http     
  bind *:9696     
  balance source     
  option tcpka     
  maxconn 10000     
  server controllernode1 192.168.21.11:9696 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:9696 check inter 2000 rise 2 fall 5

listen dashboard    
  mode http     
  bind *:80     
  balance source     
  option tcpka     
  maxconn 10000     
  server controllernode1 192.168.21.11:80 check inter 2000 rise 2 fall 5     
  server controllernode2 192.168.21.12:80 check inter 2000 rise 2 fall 5     
[root@networknode1 ~]#

节点2HAProxy配置文件:可以与节点1配置文件相同

节点1Keepalived配置文件

[root@networknode1 ~]# cat /etc/keepalived/keepalived.conf    
! Configuration File for keepalived

global_defs {    
   notification_email {     
     dgdenterprise@gmail.com     
   }     
   notification_email_from root@controllernode1     
   smtp_server 127.0.0.1     
   smtp_connect_timeout 10     
   router_id openstackha_1     
}

vrrp_sync_group VG_1 {    
    group {     
        VI_1     
    }     
}

vrrp_instance VI_1 {    
    state BACKUP     
    interface em1     
    #use_vmac keepalived     
    #vmac_xmit_base     
    mcast_src_ip 192.168.21.21     
    virtual_router_id 20     
    priority 100     
    advert_int 1     
    authentication {     
        auth_type PASS     
        auth_pass password     
    }     
    virtual_ipaddress {     
        192.168.21.10     
    }     
}     
[root@networknode1 ~]#

节点2Keepalived配置文件

[root@networknode2 ~]# cat /etc/keepalived/keepalived.conf    
! Configuration File for keepalived

global_defs {    
   notification_email {     
     dgdenterprise@gmail.com     
   }     
   notification_email_from root@controllernode2     
   smtp_server 127.0.0.1     
   smtp_connect_timeout 10     
   router_id openstackha_2     
}

vrrp_sync_group VG_1 {    
    group {     
        VI_1     
    }     
}

vrrp_instance VI_1 {    
    state BACKUP     
    interface em1     
    #use_vmac keepalived     
    #vmac_xmit_base     
    mcast_src_ip 192.168.21.22     
    virtual_router_id 20     
    priority 99     
    advert_int 1     
    authentication {     
        auth_type PASS     
        auth_pass password     
    }     
    virtual_ipaddress {     
        192.168.21.10     
    }     
    nopreempt      
}     
[root@networknode2 ~]#

END



本文转自 urey_pp 51CTO博客,原文链接:http://blog.51cto.com/dgd2010/1603972,如需转载请自行联系原作者



相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
13 3
|
3天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
19 3
|
3天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE &#39;log_%&#39;;`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
22 2
|
17天前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
117 15
|
10天前
|
SQL 关系型数据库 MySQL
数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
|
17天前
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
21天前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
29天前
|
关系型数据库 MySQL 数据库
GBase 数据库如何像MYSQL一样存放多行数据
GBase 数据库如何像MYSQL一样存放多行数据
|
1月前
|
SQL 关系型数据库 MySQL
12 PHP配置数据库MySQL
路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
40 1
|
1月前
|
运维 关系型数据库 MySQL
安装MySQL8数据库
本文介绍了MySQL的不同版本及其特点,并详细描述了如何通过Yum源安装MySQL 8.4社区版,包括配置Yum源、安装MySQL、启动服务、设置开机自启动、修改root用户密码以及设置远程登录等步骤。最后还提供了测试连接的方法。适用于初学者和运维人员。
185 0

推荐镜像

更多