BTRFS - COW B-trees

简介: 介绍btrfs的COW特性。

转载:https://blog.csdn.net/PANGHAIFEI/article/details/99642210


文章来自于 IBM Research Report  (BTRFS - B-Tree filesystem)

b-tree不变量是一个节点在被拆分或合并之前可以维护2到5个元素。假设树节点只占用一页。 未修改的page被标记成yellow, COWed页被标记成绿色。

 图1(a) 显示了两级的初始树。图1(b)显示了在最右边叶子插入一个新的key 19。路径沿树向下遍历,并且所有修改的页面都将写入新的位置,不会更改旧的页面。

image.png

为了移除一个key,copy-on-wrire 被使用。移除操作不会修改页面,举个例子,图2展示了 key 6是怎样从树中移除的。 修改被写到一边,创建一个新版本的树。

image.png

为了克隆一棵树,它的根节点被复制,并且所有的子指针被复制。 举个例子, 图3 展示了 tree  Tp 被克隆到 Tq。 树节点用符号表示。因为修改将被用于Tq,共享将会在trees之间丢失,并且每棵树都将有自己的数据。

image.png

由于可以从多个roots到达tree  nodes,垃圾回收对于空间回收来说是需要的。实践中,文件系统是有向无环图。 多个tree共享节点,但是没有回环。 因此 参考计数(ref-counts)可以被用于追踪有多少指针指向tree nodes。一旦计数为0,这个块可以被重复使用。为了追踪ref-counts,写时复制被修改了。 当一个节点COWed, original 的ref-counts 减一,子节点的计数加一。

举例子,图4表示带有ref-counts的克隆示例。粉红色的节点除了ref-counts之外都不会改变。

image.png

图5展示了往tree Q 的H节点插入一个key,从Q到H路径的节点是{Q,C,H},他们全部被修改并且COWed。节点C和H的共享被打断。节点C的ref-count减一。

 

image.png

图6展示删除一棵树的过程。使用的算法就是递归树遍历,从根节点开始。对于每个节点N:

1. ref-count (N)>1 : 递减ref-count 并且停止往下遍历。该节点被其他树共享。

2.ref-count(N)==1 : 该节点仅属于tree q, 继续往下遍历并且重新分配节点N.

image.png


 

————————————————

                           版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

                     

原文链接:https://blog.csdn.net/PANGHAIFEI/article/details/99642210

目录
相关文章
|
Linux
centos 8 换阿里源
centos 8 换阿里源
4895 0
|
存储 关系型数据库 PostgreSQL
深入浅出PostgreSQL B-Tree索引结构
PostgreSQL 的B-Tree索引页分为几种类别 meta page root page # btpo_flags=2 branch page # btpo_flags=0 leaf page # btpo_flags=1 如果即
15177 0
|
6月前
|
运维 调度 数据安全/隐私保护
ERP系统开发中的技术难点与应对策略分析
开发ERP系统面临架构设计、数据整合、流程建模、性能优化与安全运维等多重挑战。本文详解五大技术难点及应对策略,涵盖微服务与单体架构平衡、数据迁移集成方案、流程引擎设计、高并发处理及权限控制等关键点,并提供实用技术栈建议与渐进式开发路线。
572 0
|
C语言
【C语言】原码、反码、补码详解 -《码上有道 ! 》
在计算机科学中,整数的表示方式有多种,包括原码、反码和补码。这些表示方式主要用于解决整数的二进制表示和计算问题。本文将详细介绍这三种表示方法,并通过示例来说明它们的原理和应用,特别是它们在C语言中的应用。
2550 5
|
存储 缓存 负载均衡
图解一致性哈希算法,看这一篇就够了!
近段时间一直在总结分布式系统架构常见的算法。前面我们介绍过布隆过滤器算法。接下来介绍一个非常重要、也非常实用的算法:一致性哈希算法。通过介绍一致性哈希算法的原理并给出了一种实现和实际运用的案例,带大家真正理解一致性哈希算法。
28126 66
图解一致性哈希算法,看这一篇就够了!
|
开发工具 git
Git 中 merge 和 rebase 的区别
$ git pull --rebase和$ git pull区别 是git fetch + git merge FETCH_HEAD的缩写,所以默认情况下,git pull就是先fetch,然后执行merge操作,如果加-rebase参数,就是使用git rebase代替git merge 。
30671 0
|
SQL 存储 NoSQL
附PPT下载|DTCC演讲:降本增效,阿里云一站式数据库上云最佳实践
在第十三届中国数据库技术大会(DTCC 2022)上,阿里云数据库高级解决方案架构师王林平从上云路径、云上数据库使用实践及使用进阶等方案深入介绍了阿里云一站式数据库上云最佳实践。 本文内容根据演讲录音以及PPT整理而成。
附PPT下载|DTCC演讲:降本增效,阿里云一站式数据库上云最佳实践
|
关系型数据库 MySQL
mysql下载源码方法
方法一 进入mysql官网:http://dev.mysql.com/downloads/mysql/ 选择相关的平台下载:     3.选择Source Code 选型后,拉倒网页下方,选择要下载的源码包         4.
15164 2
|
Linux 调度 虚拟化
深入剖析docker核心技术(namespace、cgroups、union fs、网络)(一)
深入剖析docker核心技术(namespace、cgroups、union fs、网络)(一)
916 0
|
缓存 JavaScript 前端开发
从0到1构建跨平台Electron应用,这篇文章就够了
Electron是一个可以直接开发构建跨平台应用的库,简单、快捷。 《Electron从0到1构建跨平台应用》这篇文章,我摘录了我自己在真实项目中,从开发到生成安装包的要点。
1945 0