3.3.4 未来展望
CephFS 的设计理念与实际开发的特性比较先进、全面,从 MDS 的动态目录树 / 目录分片设计,到加密 / 快照等高级企业级功能实现,CephFS 的“野心”不可谓不大。但开源版本的 CephFS 目前并未被大规模商用,说明开源版本 CephFS 还不足够成熟,部分厂商甚至借鉴了 CephFS 的架构做了新的实现,在企业级分布式文件存储市场上披荆斩棘。对此现状,我们分析有以下原因。
1. 架构原因
CephFS 的 MDS 中有着整个文件目录树缓存,元数据最终的持久化是在 MDS Pool 中,元数据读写盘需要同样走一遍 PG/OSD 的 I/O 路径。在上千万甚至上亿文件数据量的场景下,MDS 的缓存命中率明显降低,元数据的性能下降导致整体性能下降。而从 Ceph 官网社区“单 MDS 稳定,多 MDS 不稳定”的宣称看,我们对 CephFS 支撑企业级大文件数据量存储的能力依旧要打个问号。
2. 实现原因
CephFS 的设计理念非常强大,有着各种高级功能与模块,从而导致了工程实现难度的提高。从代码分析看,整个 MDS 的代码复杂度是较高的。在全量测试中,各类小问题依旧可见,整体表现不够稳定。对于企业存储,数据存储的安全性和存储业务的稳定性一定是放在第一位的,这也是 CephFS 必须面对的问题。
当然,虽然 CephFS 有以上所述的各类问题,但 Ceph 社区在 CephFS 项目上依旧有不断的人员投入。同时,已知有较多的技术企业在采用CephFS作为内部文件存储支撑系统,他们也将会不断致力于 CephFS 的成熟及优化,因此我们有理由认为,CephFS 的未来依旧可期。