带你读《云存储应用白皮书》之10:1. 自研分布式存储技术

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 带你读《云存储应用白皮书》之10:1. 自研分布式存储技术

技术产品


一、强大的技术基因


1. 自研分布式存储技术


1十年磨一剑的飞天盘古


分布式存储因其支持块、文件、HDFS、对象多种协议的特性,具有较好的场景适应性。面向云计算的大规模分布式存储系统,往往需要历经纯软件技术架构、用户态技术架构,再到软硬一体全栈融合技术架构的发展阶段。


2008年问世以来,飞天盘古作为阿里巴巴集团、蚂蚁集团业务的数据存储平台,在存储技术的理解、分析、分类和抽象等方面持续创新,一方面为了适应硬件的迭代更新;另一方面还要满足大规模及复杂业务场景的存储需求,主要体现在四个方面,即开放分层的分布式存储软件、高性能存储网络、硬件适配性和硬件架构创新,以及深度软硬融合的闪存存储架构。


一个大规模、高性能、高可靠、高可用、可伸缩的分布式存储平台,不仅需要为对象存储、表格存储、块存储、文件存储等不同存储产品提供分布式持久化核心存储层,而且要为上层的大数据处理、数据库、中间件、日志分析、邮箱、搜索等基础服务提供底层数据存储服务。

 

image.png 

 

 

2稳定压倒一切


开放分层的软件架构是飞天盘古在系统架构演进上的重要实践经验。飞天盘古数据服务层从上到下分为飞天盘古服务层、飞天盘古分布式功能层、单机存储引擎层和软硬件一体化层。


飞天盘古分布式功能层是一个公共的基础核心,提供多副本文件(典型配置为三副本)及纠删码文件的文件语义,并支持Direct I/OBuffer I/O适应不同业务访问模式的需求。


分布式功能层采用分布式元数据管理,支持单集群的大规模及系统的可伸缩性;提供良好设计的异常处理机制及数据复制机制,保证节点异常的性能稳定性及数据可靠性;采用端到端的QoS保证业务运行的SLA;采用端到端的CRC校验保证数据传输和存储过程中的数据完整性;后台CRC校验机制保障数据持久存储的可靠性;支持快速介质与慢速介质构成的混合存储模式,达到性能与成本的均衡。


3性能是极致追求


开放分层架构具备定义稳定和良好的接口,有利于系统自身的快速迭代。不仅如此,飞天盘古针对不同的硬件特点及应用场景进行了深度的优化和设计,包括:


分布式元数据服务。增强整体系统的元数据服务器能力,支持海量文件规模、灵活伸缩扩展,并摒弃中心节点带来的不足,提升分布式存储的可靠性及性能。


自研的分布式一致性协议。对软硬件异常进行容错,在保证可靠性的基础之上提升性能。


分布式纠删码技术将数据冗余从典型的3份副本降低至1.5份副本以下。


全自研的用户态存储引擎支持NVMe SSDHDD介质,充分发挥NVMe的性能,保证后端存储的I/O延时在10us以内;通过用户态存储引擎挖掘HDD磁盘的吞吐带宽,比基于Ext4的存储引擎性能翻倍。


全链路SLA服务保证I/O的稳定性,通过异常节点探测算法、异步写追加等方法来增强端至端的I/O服务质量。


在网络互联方面,飞天盘古针对存储网络面临的低延时、高吞吐、CPU占用等问题,提出了新的存储网络协议及技术架构。具体包括用户态TCP协议栈Luna、增强型RoCERDMA over Converged Ethernet)、全自研RDMA网络协议及软硬一体技术架构。在规模化生产环境下,端至端I/O延时降低至100us以内,造就了全球性能第一的ESSD云盘。

相关文章
|
11天前
|
监控 数据可视化 Java
【JAVA】分布式链路追踪技术概论
【JAVA】分布式链路追踪技术概论
22 2
|
11天前
|
存储 消息中间件 Java
【分布式链路追踪技术】sleuth+zipkin
【分布式链路追踪技术】sleuth+zipkin
20 1
|
12天前
|
存储 Kubernetes 监控
etcd:分布式键值存储系统技术
`etcd` 是一个用于共享配置和服务发现的高度可用键值存储系统,基于Raft算法保证数据一致性。它提供HTTP/GRPC API,常用于服务发现、配置共享和分布式锁。etcd集群包含多个节点,每个节点可为领导者或跟随者。在Kubernetes中,etcd存储集群状态,其稳定性和一致性至关重要。维护etcd涉及备份、状态监控、日志审计和安全措施。
21 2
|
18天前
|
监控 NoSQL 数据建模
使用Apache Cassandra进行分布式数据库管理的技术实践
【6月更文挑战第5天】本文探讨了使用Apache Cassandra进行分布式数据库管理的技术实践。Cassandra是一款高性能、可扩展的NoSQL数据库,适合大规模、高并发场景。文章介绍了其高可扩展性、高性能、高可用性和灵活数据模型等核心特性,并详细阐述了环境准备、安装配置、数据建模与查询以及性能优化与监控的步骤。通过本文,读者可掌握Cassandra的运用,适应不断增长的数据需求。
|
19天前
|
存储 分布式计算 Hadoop
使用Apache Hadoop进行分布式计算的技术详解
【6月更文挑战第4天】Apache Hadoop是一个分布式系统框架,应对大数据处理需求。它包括HDFS(分布式文件系统)和MapReduce编程模型。Hadoop架构由HDFS、YARN(资源管理器)、MapReduce及通用库组成。通过环境搭建、编写MapReduce程序,可实现分布式计算。例如,WordCount程序用于统计单词频率。优化HDFS和MapReduce性能,结合Hadoop生态系统工具,能提升整体效率。随着技术发展,Hadoop在大数据领域将持续发挥关键作用。
|
2天前
|
供应链 监控 物联网
区块链通过其独特的分布式账本技术和智能合约功能,确保供应链信息的实时更新
**区块链技术革新供应链:分布式账本确保信息实时一致,智能合约自动执行降低错误,物联网追踪增强透明度和信任。通过去中心化、不可篡改的特性,实现交易验证、货物追踪与业务规则自动化,提升供应链效率与安全性。**
|
1月前
|
消息中间件 存储 Java
Java分布式技术面试总结(全面,实时更新)
Java分布式技术面试总结(全面,实时更新)
|
11天前
|
存储 大数据 Linux
【大数据】GFS,大数据技术的基石,分布式文件系统的鼻祖
【大数据】GFS,大数据技术的基石,分布式文件系统的鼻祖
25 0
|
13天前
|
供应链 物联网 分布式数据库
区块链技术作为一种新兴的分布式数据库技术,正逐渐改变着我们的生产和生活方式。而智能合约作为区块链技术的重要应用之一
【6月更文挑战第10天】本文探讨了区块链技术与智能合约的界限及其带来的挑战。区块链,以其不可篡改性和安全性,已广泛应用于金融、供应链和物联网等领域。智能合约作为区块链的关键应用,实现了自动、安全和不可篡改的合约执行。然而,技术上的扩展性、性能问题和安全漏洞,以及法律监管的困境,构成了当前的主要挑战。尽管如此,随着技术进步和应用场景的拓宽,区块链与智能合约有望在未来发挥更大潜力。
55 0
|
1月前
|
监控 数据可视化 Java
【JAVA】分布式链路追踪技术概论
skywalking拥有更加的强大和细粒度的图形监控界面。
34 2