技术是生态。随着以云计算与大数据为代表的新一代信息技术的兴起,底层的存储技 术也开始从硬件资源到软件系统全面更新换代,尤其是分布式存储技术,受到了业界的广 泛关注。分布式存储系统所具有的高效 I/O 访问、海量存储、高性能和弹性扩展等特性,助力了云计算与大数据技术的快速发展。随着技术的演进和需求的迭代,云计算与大数据 服务也对分布式存储系统提出了更高的要求,如对数据存储的安全性以及隐私性要求、对 存储集群在 PB级甚至EB 级建设规模下的成本要求、对繁杂数据格式的预处理能力要求以及对价值密度较低数据的压缩、去重能力要求等。
除了满足正常的存储业务需求以外,分布式存储系统还需要保障整个系统的稳定性及易用性等。这需要通过解决各类软硬件故障和亚健康问题来提升整个系统的健壮性,需要满足多样化的运维需求来提升系统的可运维性,需要提供丰富的监控指标来提升系统的可观测性。
开发与使用如此复杂的系统,对于任何一个团队来说,都不是一件容易的事。幸运的是,我们的世界正处于开源的潮流之中,拥抱开源文化可实现社会分工协作,参与开源项目可 共享智慧凝聚成果。站在开源技术这个“巨人的肩膀”上,开发与使用分布式存储系统开始变得相对容易了一些。但在使用过程中,如何解决开源系统的能力标准化问题,即如何 匹配企业的私有需求与开源系统标准功能之间的差异,如何平衡开源系统与商业产品之间 的关系,都将会是企业在真正使用开源系统时不可避免的问题。
实践出真知。中国移动在开源分布式存储项目Ceph上的实践,是一个企业积极拥抱开源,快速实现商业价值落地的极佳案例。“我来,我见,我征服!”中国移动基于Ceph多年的生产经验形成了对分布式存储及开源系统的独特感悟,相信阅读和学习本书,除了能解答读者的技术问题,更能够引发读者关于分布式存储与开源系统融合的思考。
对分布式存储系统关注者而言,本书实为不可错过的技术盛宴。
中国信息通信研究院云计算与大数据研究所
何宝宏
2021年 6月 8日于北京