CentOS 7.6 部署 GlusterFS 分布式存储系统

简介: CentOS 7.6 部署 GlusterFS 分布式存储系统

GlusterFS简介

GlusterFS是一个开源的分布式文件系统,是Scale存储的核心,能够处理千数量级的客户端

整合了许多存储块(server)通过Infiniband RDMA或者 TCP/IP方式互联的一个并行的网络文件系统。

GlusterFS的特征:

  • 容量可以按比例的扩展,且性能却不会因此而降低。
  • 廉价且使用简单,完全抽象在已有的文件系统之上。
  • 扩展和容错设计的比较合理,复杂度较低
  • 适应性强,部署方便,对环境依赖低,使用,调试和维护便利

环境介绍

部署GlusterFS分布式存储系统,需要给机器增加一块新磁盘,磁盘是需要被格式化的

GlusterFS最少需要两个节点,内存最低需要1G

IP HOSTNAME SYSTEM-VERSION
192.168.72.73 glusterfs-01 centos7.6
192.168.72.74 glusterfs-02 centos7.6

开始GlusterFS部署

参考centos官网提供的glusterfs部署:gluster-Quickstart

如果不是外网服务器,firewalld服务可以直接关掉,需要关闭selinux服务,重启后才会生效

selinux的关闭方式:sed -i "s/SELINUX=enforcing/SELINUX=disabled/g" /etc/selinux/config

# cat /etc/redhat-release
CentOS Linux release 7.6.1810 (Core)
# systemctl status firewalld.service | grep active
   Active: inactive (dead)
# sestatus
SELinux status:                 disabled

没有特殊提醒的前提下,以下所有操作,所有的机器都需要操作

配置hosts解析

# cat >> /etc/hosts <<EOF
192.168.72.73 glusterfs-01
192.168.72.74 glusterfs-02
EOF

配置GlusterFS

# yum install -y centos-release-gluster

创建文件系统

  • 这一步不是必须的,只是实验使用,所以新增了磁盘,单独给 gfs 使用,一定要切记,如果要和下面的步骤一致,一定要使用新的没有数据的磁盘来操作,否则会造成数据的丢失

可以使用lsblk命令查看新磁盘的盘符,不要完全复制我的文档

这里要用xfs格式化磁盘,并且xfs的文件格式支持PB级的数据量

如果是centos6系列的,需要安装xfs支持包:yum install -y xfsprogs

所有节点都需要执行下面的操作

# mkfs.xfs -i size=512 /dev/sdb
# mkdir -p /data/glusterfs_data
# echo '/dev/sdb /data/glusterfs_data xfs defaults 0 0' >> /etc/fstab
# mount -a

安装GlusterFS

# yum install -y glusterfs-server

启动GlusterFS

# systemctl enable glusterd --now
# systemctl status glusterd | grep active
   Active: active (running) since Sun 2021-05-09 00:33:20 CST; 21s ago

将节点加入到主机池

这个操作,只需要在glusterfs-01机器上操作即可

# gluster peer probe glusterfs-02
peer probe: success

查看主机池的状态

# gluster pool list
UUID                                    Hostname        State
4364f3d9-5be4-4f8f-9e8c-a47edb099bf0    glusterfs-02    Connected
3cb3da7f-f923-42b7-908e-901533468055    localhost       Connected
# gluster peer status
Number of Peers: 1
Hostname: glusterfs-02
Uuid: 4364f3d9-5be4-4f8f-9e8c-a47edb099bf0
State: Peer in Cluster (Connected)

创建GlusterFS复制卷

以下的操作,在 glusterfs-01机器上操作即可

# gluster volume create online-share replica 2 glusterfs-01:/data/glusterfs_data glusterfs-02:/data/glusterfs_data
# gluster volume start online-share
# gluster volume info
Volume Name: online-share
Type: Replicate
Volume ID: 84ce70ca-cd50-4680-ad6c-5a82ea9bb148
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: glusterfs-01:/data/glusterfs_data
Brick2: glusterfs-02:/data/glusterfs_data
Options Reconfigured:
cluster.granular-entry-heal: on
storage.fips-mode-rchecksum: on
transport.address-family: inet
nfs.disable: on
performance.client-io-threads: off

GlusterFS测试

  • 如果出现报错:mount: unknown filesystem type 'glusterfs' 需要安装一下 glusterfs-fuse,使用命令:yum install -y glusterfs-fuse
# mount -t glusterfs glusterfs-01:/online-share /mnt
# df -Th | grep glusterfs
glusterfs-01:/online-share       fuse.glusterfs   10G  135M  9.9G   2% /mnt

也可以写进 fstab,实现重启后自动挂载,但是也会有缺点,如果 gfs 有问题,挂载失败了,会导致开机异常

# vim /etc/fstab
glusterfs-01:online-share /mnt defaults 0 0
# mount -a  # 不报错表示挂载成功了

也可以写进 rc.local 里面,这样就是有问题,也不会影响重启后进入操作系统

# echo 'mount -t glusterfs glusterfs-01:/online-share /mnt' >> /etc/rc.local
# chmod +x /etc/rc.local

因为是复制卷,所以可用容量为一半(我是两台机器各增加了一块10G的新磁盘)

# for i in `seq -w 1 100`; do cp -rp /var/log/messages /mnt/copy-test-$i; done
# ls -lA /data/glusterfs_data
# ls -lA /mnt

可以看到,两边的文件都是一致的

到这里,GlusterFS已经部署完成了

关于GlusterFS其他卷的配置,可以看这位大佬的博客:GlusterFS分布式存储

目录
相关文章
|
6月前
|
Kubernetes 大数据 调度
Airflow vs Argo Workflows:分布式任务调度系统的“华山论剑”
本文对比了Apache Airflow与Argo Workflows两大分布式任务调度系统。两者均支持复杂的DAG任务编排、社区支持及任务调度功能,且具备优秀的用户界面。Airflow以Python为核心语言,适合数据科学家使用,拥有丰富的Operator库和云服务集成能力;而Argo Workflows基于Kubernetes设计,支持YAML和Python双语定义工作流,具备轻量化、高性能并发调度的优势,并通过Kubernetes的RBAC机制实现多用户隔离。在大数据和AI场景中,Airflow擅长结合云厂商服务,Argo则更适配Kubernetes生态下的深度集成。
856 34
|
2月前
|
存储 算法 安全
“卧槽,系统又崩了!”——别慌,这也许是你看过最通俗易懂的分布式入门
本文深入解析分布式系统核心机制:数据分片与冗余副本实现扩展与高可用,租约、多数派及Gossip协议保障一致性与容错。探讨节点故障、网络延迟等挑战,揭示CFT/BFT容错原理,剖析规模与性能关系,为构建可靠分布式系统提供理论支撑。
217 2
|
2月前
|
机器学习/深度学习 算法 安全
新型电力系统下多分布式电源接入配电网承载力评估方法研究(Matlab代码实现)
新型电力系统下多分布式电源接入配电网承载力评估方法研究(Matlab代码实现)
124 3
|
4月前
|
数据采集 缓存 NoSQL
分布式新闻数据采集系统的同步效率优化实战
本文介绍了一个针对高频新闻站点的分布式爬虫系统优化方案。通过引入异步任务机制、本地缓存池、Redis pipeline 批量写入及身份池策略,系统采集效率提升近两倍,数据同步延迟显著降低,实现了分钟级热点追踪能力,为实时舆情监控与分析提供了高效、稳定的数据支持。
163 1
分布式新闻数据采集系统的同步效率优化实战
|
6月前
|
监控 Linux 应用服务中间件
Linux多节点多硬盘部署MinIO:分布式MinIO集群部署指南搭建高可用架构实践
通过以上步骤,已成功基于已有的 MinIO 服务,扩展为一个 MinIO 集群。该集群具有高可用性和容错性,适合生产环境使用。如果有任何问题,请检查日志或参考MinIO 官方文档。作者联系方式vx:2743642415。
2202 57
|
7月前
|
SQL 数据可视化 网络安全
YashanDB分布式可视化部署
本文介绍YashanDB的分布式部署流程,涵盖服务端安装、数据库基本信息与服务器配置、节点信息设置、建库参数调整、环境变量配置及安装结果检查等步骤。通过可视化Web界面操作,详细说明了各环节配置方法和注意事项,确保用户顺利完成数据库集群的搭建与初始化设置。适用于需要分布式数据库部署的场景,提供全面的操作指导。
YashanDB分布式可视化部署
|
8月前
|
运维 Kubernetes Java
Koupleless 助力「人力家」实现分布式研发集中式部署,又快又省!
本文由仁励家网络科技(杭州)有限公司架构师赵云兴、葛志刚撰写,探讨了公司在优化HR SaaS解决方案时遇到的系统资源浪费和运维成本高的问题。通过引入Koupleless框架,成功将模块体积从500M缩减至5M以下,部署时间从6分钟缩短至3分钟,并大幅节省服务器资源。文章详细介绍了Koupleless的部署方案及优化措施,感谢Koupleless团队的专业支持,使人力家实现了多应用合并部署,降低了运维成本。
Koupleless 助力「人力家」实现分布式研发集中式部署,又快又省!
|
8月前
|
运维 Kubernetes Java
Koupleless 助力「人力家」实现分布式研发集中式部署,又快又省!
通过引入Koupleless框架,解决了多应用部署中资源浪费和运维成本高的问题,实现了模块瘦身、快速部署及流量控制优化,大幅降低了服务器资源占用和发布耗时,提升了系统稳定性和运维效率。最终,人力家成功实现了多应用的轻量集中部署,显著减少了运维成本。
 Koupleless 助力「人力家」实现分布式研发集中式部署,又快又省!
|
3月前
|
存储 Ubuntu Linux
VMware-安装CentOS系统教程及安装包
虚拟机相当于是一个独立于你电脑的环境,在这个环境上面,你可以安装Linux、Windows、Ubuntu等各个类型各个版本的系统,在这个系统里面你不用担心有病读等,不用担心文件误删导致系统崩溃。 虚拟机也和正常的电脑系统是一样的,也可以开关机,不用的时候,你关机就可以了,也不会占用你的系统资源,使用起来还是比较方便 这里也有已经做好的CentOS 7系统,下载下来解压后直接用VMware打开就可以使用
769 69