Ceph分布式存储性能调优(六)(上)

简介: Ceph分布式存储性能调优(六)(上)

Ceph分布式存储性能调优



image.png


一、系统配置调优


1、设置磁盘的预读缓存


echo "8192" > /sys/block/sda/queue/read_ahead_kb


2、设置系统的进程数量


echo 4194303 > /proc/sys/kernel/pid_max


3、调整CPU性能


注意: 虚拟机和部分硬件 CPU 可能不支持调整。

1 ) 确保安装了内核调整工具:


yum -y install kernel-tools


2)调整为性能模式


可以针对每个核心做调整:


echo performance > /sys/devices/system/cpu/cpu${i}/cpufreq/scaling_governor


或者通过 CPU 工具进行调整:


cpupower frequency-set -g performance


支持五种运行模式调整:


performance :只注重效率,将 CPU 频率固定工作在其支持的最高运行频率上,该模式是对系统高性能的最大追求。

powersave :将 CPU 频率设置为最低的所谓 “

省电 ” 模式, CPU 会固定工作在其支持的最低运行频率上,该模式是对系统低功耗的最大追求。


userspace :系统将变频策略的决策权交给了用户态应用程序,并提供相应接口供用户态应用程序调节CPU 运行频率使用。


ondemand : 按需快速动态调整 CPU 频率, 一有 cpu 计算量的任务,就会立即达到最大频率运行,等执行完毕就立即回到最低频率。


conservative : 它是平滑地调整 CPU 频率,频率的升降是渐变式的 , 会自动在频率上下限调整,和ondemand 模式的主要区别在于它会按需渐进式分配频率,而不是一味追求最高频

率 . 。


3)部分硬件可能不支持,调整会出现如下错误:


[root@CENTOS7-1 ~]# cpupower frequency-set -g performance
Setting cpu: 0
Error setting new values. Common errors: 
- Do you have proper administration rights? (super-user?) 
- Is the governor you requested available and modprobed? 
- Trying to set an invalid policy? 
- Trying to set a specific frequency, but userspace governor is not available,
 for example because of hardware which cannot be set to a specific frequency 
or because the userspace governor isn't loaded?


4、优化网络参数


修改配置文件:


vi /etc/sysctl.d/ceph.conf


配置内容:  


net.ipv4.tcp_rmem = 4096 87380 16777216 
net.ipv4.tcp_wmem = 4096 16384 16777216 
net.core.rmem_max = 16777216 
net.core.wmem_max = 16777216


执行生效:


sysctl -p /etc/sysctl.d/ceph.conf



二、Ceph集群优化配置



1、Ceph的主要配置参数


FILESTORE 配置参数:


image.png


journal 配置参数:


image.png


osd config tuning 配置参数:


image.png


osd - recovery tuning 配置参数:


image.png


osd - client tuning 配置参数:


image.png


2、优化配置示例


b2561174c47f4ae89157cce6b3fef4c6.png61f0234eb86945c5b60fa4c44c27710c.png




目录
相关文章
|
21天前
|
人工智能 弹性计算 监控
分布式大模型训练的性能建模与调优
阿里云智能集团弹性计算高级技术专家林立翔分享了分布式大模型训练的性能建模与调优。内容涵盖四大方面:1) 大模型对AI基础设施的性能挑战,强调规模增大带来的显存和算力需求;2) 大模型训练的性能分析和建模,介绍TOP-DOWN和bottom-up方法论及工具;3) 基于建模分析的性能优化,通过案例展示显存预估和流水线失衡优化;4) 宣传阿里云AI基础设施,提供高效算力集群、网络及软件支持,助力大模型训练与推理。
|
24天前
|
机器学习/深度学习 分布式计算 数据挖掘
MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎
MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。
51 4
|
4月前
|
存储 块存储
ceph分布式存储系统常见术语篇
关于Ceph分布式存储系统的常见术语解释和概述。
235 1
ceph分布式存储系统常见术语篇
|
4月前
|
存储 Kubernetes 数据安全/隐私保护
k8s对接ceph集群的分布式文件系统CephFS
文章介绍了如何在Kubernetes集群中使用CephFS作为持久化存储,包括通过secretFile和secretRef两种方式进行认证和配置。
153 5
|
5月前
|
开发者 云计算 数据库
从桌面跃升至云端的华丽转身:深入解析如何运用WinForms与Azure的强大组合,解锁传统应用向现代化分布式系统演变的秘密,实现性能与安全性的双重飞跃——你不可不知的开发新模式
【8月更文挑战第31天】在数字化转型浪潮中,传统桌面应用面临新挑战。本文探讨如何融合Windows Forms(WinForms)与Microsoft Azure,助力应用向云端转型。通过Azure的虚拟机、容器及无服务器计算,可轻松解决性能瓶颈,满足全球用户需求。文中还提供了连接Azure数据库的示例代码,并介绍了集成Azure Storage和Functions的方法。尽管存在安全性、网络延迟及成本等问题,但合理设计架构可有效应对,帮助开发者构建高效可靠的现代应用。
46 0
|
5月前
|
UED 存储 数据管理
深度解析 Uno Platform 离线状态处理技巧:从网络检测到本地存储同步,全方位提升跨平台应用在无网环境下的用户体验与数据管理策略
【8月更文挑战第31天】处理离线状态下的用户体验是现代应用开发的关键。本文通过在线笔记应用案例,介绍如何使用 Uno Platform 优雅地应对离线状态。首先,利用 `NetworkInformation` 类检测网络状态;其次,使用 SQLite 实现离线存储;然后,在网络恢复时同步数据;最后,通过 UI 反馈提升用户体验。
132 0
|
5月前
|
机器学习/深度学习 TensorFlow 数据处理
分布式训练在TensorFlow中的全面应用指南:掌握多机多卡配置与实践技巧,让大规模数据集训练变得轻而易举,大幅提升模型训练效率与性能
【8月更文挑战第31天】本文详细介绍了如何在Tensorflow中实现多机多卡的分布式训练,涵盖环境配置、模型定义、数据处理及训练执行等关键环节。通过具体示例代码,展示了使用`MultiWorkerMirroredStrategy`进行分布式训练的过程,帮助读者更好地应对大规模数据集与复杂模型带来的挑战,提升训练效率。
138 0
|
7月前
|
存储 安全 关系型数据库
分布式数据库的性能和安全麻烦
【6月更文挑战第6天】该文探讨了分布式系统中节点交互的两种方式,并对比mysql和oracle两个数据库的CAP平衡模式。
74 0
分布式数据库的性能和安全麻烦
|
3月前
|
NoSQL Java Redis
太惨痛: Redis 分布式锁 5个大坑,又大又深, 如何才能 避开 ?
Redis分布式锁在高并发场景下是重要的技术手段,但其实现过程中常遇到五大深坑:**原子性问题**、**连接耗尽问题**、**锁过期问题**、**锁失效问题**以及**锁分段问题**。这些问题不仅影响系统的稳定性和性能,还可能导致数据不一致。尼恩在实际项目中总结了这些坑,并提供了详细的解决方案,包括使用Lua脚本保证原子性、设置合理的锁过期时间和使用看门狗机制、以及通过锁分段提升性能。这些经验和技巧对面试和实际开发都有很大帮助,值得深入学习和实践。
太惨痛: Redis 分布式锁 5个大坑,又大又深, 如何才能 避开 ?
|
1月前
|
存储 NoSQL Java
使用lock4j-redis-template-spring-boot-starter实现redis分布式锁
通过使用 `lock4j-redis-template-spring-boot-starter`,我们可以轻松实现 Redis 分布式锁,从而解决分布式系统中多个实例并发访问共享资源的问题。合理配置和使用分布式锁,可以有效提高系统的稳定性和数据的一致性。希望本文对你在实际项目中使用 Redis 分布式锁有所帮助。
163 5