GlusterFS概述
开源的分布式文件系统,由存储服务器、客户端以及NFS/Samba 存储网关组成。GlusterFS分布式文件系统是基于无源服务器的设计。
🍤GlusterFS的特点
- 扩展性和高性能:GlusterFs利用双重特性来提供高容量存储解决方案。
- 高可用性:GlusterFS通过配置某些类型的存储卷,可以对文件进行自动复制,即便某个节点出现故障,也不
影响数据的访问。 - 全局统一命名空间:全局统一命名空间将所有的存储资源聚集成一个单一的虚拟存储池,对用户和应用屏蔽了物理存储信息。
- 弹性卷管理:GlusterFS通过将数据存储在逻辑卷中,逻辑卷从逻辑存储池进行独立逻辑划分。
- 基于标准协议:GlusterFS存储服务支持NFS、CIFS、HTTP、FTP、SMB及Gluster原生协议,完全与POSIX标准兼容。
🍤GlusterFS术语
Brick:指可信主机池中有主机提供的用于物理存储的专用分区,是GlusterFS中的基本存储单元,同时也是可信存储池中服务器上对外提供的存储目录。存储目录的格式由服务器和目录的绝对路径构成,表示方法为SERVER:EXPORT,如192.168.10:/data/mydir/。
Volume:一个逻辑卷是一组Brick的集合。卷是数据存储的逻辑设备,类似于LVM中的逻辑卷。大部分Gluster管理操作是卷上进行的。
FUSE:是一个内核模块,允许用户创建自己的文件系统,无需修改内核代码。
VFS:内核空间对用户空间提供的访问磁盘的接口。
Gluster:在存储群集中的每个节点上都要运行。
🍤模块化堆栈式架构
模块化、堆栈式的架构
通过对模块的组合,实现复杂的功能
🍤GlusterFS工作原理
- 客户端或应用程序通过GlusterFS的挂载点访问数据。
- linux系统内核通过VFS API收到请求并处理。
- VFS将数据递交给FUSE内核文件系统, fuse文件系统则是将数据通过/dev/fuse设备文件递交给了GlusterFS client端。
- GlusterFS client 收到数据后,client根据配置文件的配置对数据进行处理。
- 通过网络将数据传递至远端的GlusterFS Server,并且将数据写入到服务器存储设备上。
🍤弹性HASH算法
通过HASH算法得到一个32位的整数,划分为N个连续的子空间,每个空间对应一个Brick。
🍤弹性HASH算法的优点
保证数据平均分布在每一个Brick中。
解决了对元数据服务器的依赖,进而解决了单点故障以及访问瓶颈。
GlusterFS的卷类型
GlusterFS支持七种卷,即分布式卷、条带卷、复制卷、分布式条带卷、分布式复制卷、条带复制卷和分布式条带复制卷,这七种卷可以满足不同应用对高性能、高可用的需求。
分布式卷
没有对文件进行分块处理
通过扩展文件属性保存HASH值
支持的底层文件系统有ext3、ext4、ZFS、XFS等
🍤特点:
文件分布在不同的服务器,不具备冗余性
更容易和廉价地扩展卷的大小
单点故障会造成数据丢失
下图中,没有分块处理,文件只能存在一个server中,效率不提升。
🍤创建分布式卷:
创建一个名为dis-volume的分布式卷,文件将根据HASH分布在server1:/dir1、server2:/dir2和server3:/dir3中。
gluster volume create dis-volume server1:/dir1 server2:/dir2
条带卷
根据偏移量将文件分成N块(N个条带节点),轮询的存储在每个Brick Server节点
存储大文件时,性能尤为突出
不具备冗余性,类似Raid0
🍤特点:
数据被分割成更小块分布到块服务器群中的不同条带区
分布减少了负载且更小的文件加速了存取的速度
没有数据冗余
下图中,从多个server中同时读取文件,效率提升
🍤创建条带卷
创建了一个名为Stripe-volume的条带卷,文件将被分块轮询的存储在Server1:/dir1和Server2:/dir2两个Brick中。
gluster volume create stripe-volume stripe 2 transport tcp server1:/dir1 server2:/dir2
复制卷
同一文件保存一份或多分副本
复制模式因为要保存副本,所以磁盘利用率较低
多个节点上的存储空间不一致,那么将按照木桶效应取最低节点的容量作为该卷的总容量
🍤特点:
卷中所有的服务器均保存一个完整的副本
卷的副本数量可由客户创建的时候决定
至少由两个块服务器或更多服务器
具备冗余性
🍤创建复制卷
创建名为rep-volume的复制卷,文件将同时存储两个副本,分别在Server1:/dir1和Server2:/dir2两个Brick中。
gluster volume create rep-volume replica 2 transport tcp server1:/dir1 server2:/dir2
分布式条带卷
兼顾分布式卷和条带卷的功能
主要用于大文件访问处理
至少最少需要 4 台服务器
🍤创建分布式条带卷
创建了一个名为dis-stripe的分布式条带卷,配置分布式的条带卷时,卷中Brick所包含的存储服务器数必须是条带数的倍数(>=2倍)
gluster volume create dis-stripe stripe 2 transport tcp server1:/dir1 server2:/dir2
分布式复制卷
兼顾分布式卷和复制卷的功能
用于需要冗余的情况下
🍤创建分布式复制卷
创建了一个名为dis-rep的分布式条带卷,配置分布式的复制卷时,卷中Brick所包含的存储服务器数必须是条带数的倍数(>=2倍)。
gluster volume create dis-rep replica 2 transport tcp server1:/dir1 server2:/dir2
GlusterFS部署
🍤部署群集环境
🍤根据下表中配置服务器卷内容。
卷名称 | 卷类型 | 空间大小 | Brick |
dis-volume | 分布式卷 | 12G | node1(/e6)、node2(/e6) |
stripe-volume | 条带卷 | 10G | node1(/d5)、node2(/d5) |
rep-volume | 复制卷 | 5G | node3(/d5)、node4(/d5) |
dis-stripe | 分布式条带卷 | 12G | node1(/b3)、node2(/b3)、node3(/b3)、node4(/b3) |
dis-rep | 分布式复制卷 | 8G | node1(/c4)、node2(/c4)、node3(/c4)、node4(/c4) |
🍤根据下表中配置IP地址、关闭防火墙、selinux、创建挂载目录及本地hosts节点解析。
操作系统 | 系统IP | 主机名 | 挂载磁盘 | 挂载目录 |
Centos 7.3 | 192.168.8.134 | node1 | /dev/sdb(3G)/dev/sdc(4G)/dev/sdd(5G)/dev/sde(6G) | /b3/c4/d5/e6 |
Centos 7.3 | 192.168.8.136 | node2 | /dev/sdb(3G)/dev/sdc(4G)/dev/sdd(5G)/dev/sde(6G) | /b3/c4/d5/e6 |
Centos 7.3 | 192.168.8.139 | node3 | /dev/sdb(3G)/dev/sdc(4G)/dev/sdd(5G) | /b3/c4/d5 |
Centos 7.3 | 192.168.8.141 | node4 | /dev/sdb(3G)/dev/sdc(4G)/dev/sdd(5G) | /b3/c4/d5 |
案例环境配置
🍤分区并格式化,创建相应的挂载目录并挂载,最后修改配置文件使其永久生效。
🍤以下命令node1和node2分别分区b、c、d、e,node3和node4分别分区b、c、d。
1. fdisk /dev/sdb/ 2. n→p→按三次回车→w保存退出
🍤node1和node2执行以下命令格式化、创建目录、挂载目录并查看(复制粘贴即可)。
1. mkfs -t xfs /dev/sdb1 2. mkfs -t xfs /dev/sdc1 3. mkfs -t xfs /dev/sdd1 4. mkfs -t xfs /dev/sde1 5. mkdir -p /b3 /c4 /d5 /e6 6. mount /dev/sdb1 /b3 7. mount /dev/sdc1 /c4 8. mount /dev/sdd1 /d5 9. mount /dev/sde1 /e6 10. df -hT
🍤node1和node2执行以下命令永久挂载。
1. [root@localhost ~]# vim /etc/fstab 2. /dev/sdb1 /b3 xfs defaults 0 0 3. /dev/sdc1 /c4 xfs defaults 0 0 4. /dev/sdd1 /d5 xfs defaults 0 0 5. /dev/sde1 /e6 xfs defaults 0 0
🍤node3和node4执行以下命令格式化、创建目录、挂载目录并查看(复制粘贴即可)。
1. mkfs -t xfs /dev/sdb1 2. mkfs -t xfs /dev/sdc1 3. mkfs -t xfs /dev/sdd1 4. mkdir -p /b3 /c4 /d5 5. mount /dev/sdb1 /b3 6. mount /dev/sdc1 /c4 7. mount /dev/sdd1 /d5 8. df -hT
🍤node3和node4执行以下命令永久挂载。
1. [root@localhost ~]# vim /etc/fstab 2. /dev/sdb1 /b3 xfs defaults 0 0 3. /dev/sdc1 /c4 xfs defaults 0 0 4. /dev/sdd1 /d5 xfs defaults 0 0
配置hosts文件
以下操作在4个节点上修改/etc/hosts文件,添加4个节点的解析。下面以node1为例,为例区分4个节点先进行改名。(其他三台可以使用scp命令复制hosts文件)
1. [root@localhost ~]# hostnamectl set-hostname node1 2. [root@localhost ~]# bash 3. [root@node1 ~]# vim /etc/hosts 4. 192.168.1.10 node1 5. 192.168.1.20 node2 6. 192.168.1.30 node3 7. 192.168.1.40 node4
安装软件
在4个节点上操作,挂载光盘后,执行以下命令。搭建yum仓库、安装glusterfs软件并启动。如果是互联网环境中,可以指向互联网仓库(下面命令复制粘贴即可)。链接查看配置网络源仓库
1. rm -rf /etc/yum.repos.d/* 2. cat >> /etc/yum.repos.d/a.repo << END 3. [a] 4. name=a 5. baseurl=file:///media 6. gpgcheck=0 7. END 8. mount /dev/cdrom /media 9. yum -y install glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma 10. systemctl start glusterd 11. systemctl enable glusterd
添加节点
🍤下面操作在node1上执行,添加node1~node4节点。删除节点命令可以使用"gluster peer detach 节点名或ip"。
1. [root@node1 ~]# gluster peer probe node1 2. peer probe: success. Probe on localhost not needed //node1也可以不执行 3. [root@node1 ~]# gluster peer probe node2 4. peer probe: success. 5. [root@node1 ~]# gluster peer probe node3 6. peer probe: success. 7. [root@node1 ~]# gluster peer probe node4 8. peer probe: success.
查看群集状态
🍤通过以下命令在每个节点上查看群集状态,正常情况下,每个节点的输出结果为,State: Peer in Cluster (Connected)。如果显示Disconnected,请检查hosts配置文件。
1. [root@node1 ~]# gluster peer status 2. Number of Peers: 3 3. 4. Hostname: node2 5. Uuid: 0c98de8d-b471-4444-a69c-41055f34981d 6. State: Peer in Cluster (Connected) 7. 8. Hostname: node3 9. Uuid: 0032a845-6f63-4824-9226-e8fba260bdf7 10. State: Peer in Cluster (Connected) 11. 12. Hostname: node4 13. Uuid: 5f0d0fb5-91bf-4690-9c29-081aea11b774 14. State: Peer in Cluster (Connected)