linux中的优先搜索树的实现--prio_tree【转】

简介: 转自:http://blog.csdn.net/bailyzheng/article/details/8041943 linux中的优先搜索树的实现--prio_tree prio_tree在linux内核中被应用于反向内存映射,prio-tree是一棵查找树,它查找的是一个区间,为何将之组织成...

转自:http://blog.csdn.net/bailyzheng/article/details/8041943

linux中的优先搜索树的实现--prio_tree

prio_tree在linux内核中被应用于反向内存映射,prio-tree是一棵查找树,它查找的是一个区间,为何将之组织成tree是一个数学问题,简单理解就是根节点包含了所有的区间,父节点代表的区间包含了子节点代表的区间,这里的包含不是现实意义的包含,而是heap/radix意义上的包含,只要满足heap的性质以及radix的性质即可,不过大多数情况下包含的意义就是现实意义的包含,Documentation中的prio_tree.txt中的图示可以看一下,[4,3,7]是[5,2,7]和[6,1,7]的父节点,父节点区间“现实包含”了两个子节点区间,而[5,2,7]是[4,2,6]和[5,1,6]的父节点, [5,2,7]就没有“现实包含”[4,2,6],但是仍然是后者的父节点,因为它们满足了heap的性质,[5,2,7]的heap-index是7,大于[4,2,6]的heap-index。由于prio-tree首先要是一个heap(插入过程中详细说明)--处理父子关系,其次要是一个radix树--处理兄弟关系,父子间满足了heap之后还要在兄弟间满足radix性质,总之,prio-tree节点间的关系有两个层次的两种,第一层,父子关系,必须符合heap性质,第二层,兄弟关系,必须符合radix性质。
     以上简要介绍了prio-tree的性质,是所有实现的共性,linux内核的实现实现了自己的个性,如果看代码的话就会发现,linux引入了一些变量或者约束,使得prio-tree在性能,资源消耗以及代码可读性之间做出了一个完美的平衡,最值得推崇的就是linux的prio-tree中维护了一个图表,该图表约束了prio-tree的高度,该图表以一个数组实现,数组的内容其实就是该索引下最大的heap,每一个树节点都有一个index_bits字段,它表示了用index_bits个比特就能表达最大的heap,而此index_bits减1正是“这么些”比特在数组中的下标,图表如下:
bit-used    array-index    max-heap
1        0        1
2        1        11
3        2        111
4        3        1111
由上面的图表1可以推导出下面的等式,下面的等式优化了树的性能,促使了数的平衡,并且巧妙的处理了兄弟之间的关系,使之符合prio-tree的原始约束:
bit-used+1=tree-height  (等式1)
根据上述等式,mask=1UL<< (root->index_bits - 1);,这个mask代表了“当前处理的层”的最高位,它决定了待插入节点是插入左孩子还是插入右孩子。插入过程中,每下将一层,mask要右移一位,由于prio-tree是一棵二叉树,因此二进制的0和1就能决定左和右,这个性质和二叉radix查找树是一样的,一个二进制的数是由0和1组成的串,如果欲将之插入一棵radix树,那么从待插节点最高位开始依次从树根处开始和树中节点的相应位进行"&"操作,根据结果来进行左右抉择,每下降一层,比较位就右移一位,直到成功插入,这样就保证了树的radix性质,上述等式1其实并不是必不可少的,它的作用更大的意义是优化,包括代码紧凑度的优化以及时间空间的优化,没有它的话,代码不可能写成现在的prio_tree.c中如此紧凑又容易理解的形式,同时一棵树还会因为频繁的插入和删除而变得很高,这样对查找来讲是很不利的,正如宏黑树用颜色来约束平衡,AVL树用高度来约束平衡一样,prio-tree用上述等式1来约束平衡。既然用radix性质实现了一棵radix树,我们还可以用heap性质来构造一个heap,本质上也是一棵二叉树,如果将二者合并的话,就是prio-tree了,而heap的性质主要体现在父子上面,对兄弟之间并没有多大的约束,因此在prio-tree的插入过程中,基本分为三大块,第一大块是实现heap的性质,在此基础上,第二大快对待左右抉择的时候利用radix的性质以及radix的插入逻辑实现插入,两大块保证了prio-tree的性质,但是不能保证平衡性,由此在此两块的基础上尽量保证树的平衡,于是等式1起作用,以上的三块联动已经近乎完美了,但是理想情况往往不能尽满足现实需求,很多的节点都拥有相同的radix,那么根据heap的性质,它们最终将成为一个近似链表的东西,因此如果为了处理这些链表二增加树的高度(增加max-heap),那么树看起来会很不平衡的,因此单独列出一个overflow-sub-tree来处理这种情况,加入这个性质之后,prio-tree实则成了一个集heap,radix树,链表于一身的集大成,最终的结果就是prio_tree.c中的prio_tree_insert函数的实现:
insert:
cur = root->prio_tree_node;
mask = 1UL << (root->index_bits - 1);
while (mask) {
    GET_INDEX(cur, r_index, h_index);
    if (r_index == radix_index && h_index == heap_index)
        return cur;
        if (h_index < heap_index || //破坏了父子约束,因此需要交换父子
        (h_index == heap_index && r_index > radix_index)) {
        struct prio_tree_node *tmp = node;
        node = prio_tree_replace(root, cur, node);
        cur = tmp;  //需要插入的node现在已经成了被替换的node
        index = r_index; //交换所有的索引,heap索引和radix索引
        ...
    }
    if (size_flag) 
        index = heap_index - radix_index;
    else
        index = radix_index;
    if (index & mask) { //此处的if-else用于确定兄弟约束,对应位为1则往右走
        ...//右孩子为空的话直接插入右孩子的位置,返回
    } else //否则返回右孩子
        cur = cur->right;
    } else {  //对应位为0则往左走
        ...//左孩子为空的话直接插入左孩子的位置,返回
    } else //否则返回左孩子
        cur = cur->left;
    }
    mask >>= 1;  //进入下一层的radix抉择
    if (!mask) {  //处理overflow树
        mask = 1UL << (root->index_bits - 1);
        size_flag = 1;
    }
}
由于heap和radix树的逻辑都是执行过程中体现的,并且都是确定的,只有那个图表1相关的代码是prio-tree独有的,因此在prio_tree_init中必然要进行相关的初始化,可以看出,prio_tree_init进行的仅仅是图表1相关的初始化,初始化完成以后,从图表1就可以推出等式1了,由此prio-tree的运行所需要的基础设施就全部到位了:
void __init prio_tree_init(void)
{
    unsigned int i;
    for (i = 0; i < ARRAY_SIZE(index_bits_to_maxindex) - 1; i++)
        index_bits_to_maxindex[i] = (1UL << (i + 1)) - 1;
    index_bits_to_maxindex[ARRAY_SIZE(index_bits_to_maxindex) - 1] = ~0UL;
}
很多树节点的remove操作都很复杂,甚至比insert还要复杂,但是对于prio-tree来讲却是很简单的,因为prio-tree节点的heap特性,并且整个prio-tree首先肯定是一个heap,所谓的radix只是在对兄弟无约束的heap加上了兄弟间的约束而已,因此remove操作完全实际上就是一个heap调整的过程,调整完heap之后无需再关心树的radix性质,因为它只要首先是一个heap即可,在remove的每一步操作中,只要能保证树的heap性质就可以了,只需要从待删除节点往下沿着大孩子走一直到叶节点,然后再回溯回来即可,回溯过程中需要依次的将当前节点和父节点进行对换,依次进行,最终就是待删除节点的大孩子替换了待删除节点,删除至此结束,至于忽略了radix性质是否会带来树的不平衡,答案是可能不会也可能会,但不甚会,如果在remove操作时加上树的平衡性维护,那么代码将变得复杂,同时也会影响到效率。

【作者】 张昺华
【新浪微博】 张昺华--sky
【twitter】 @sky2030_
【facebook】 张昺华 zhangbinghua
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
目录
相关文章
|
2月前
|
Linux 应用服务中间件 Shell
二、Linux文本处理与文件操作核心命令
熟悉了Linux的基本“行走”后,就该拿起真正的“工具”干活了。用grep这个“放大镜”在文件里搜索内容,用find这个“探测器”在系统中寻找文件,再用tar把东西打包带走。最关键的是要学会使用管道符|,它像一条流水线,能把这些命令串联起来,让简单工具组合出强大的功能,比如 ps -ef | grep 'nginx' 就能快速找出nginx进程。
409 1
二、Linux文本处理与文件操作核心命令
|
2月前
|
Linux
linux命令—stat
`stat` 是 Linux 系统中用于查看文件或文件系统详细状态信息的命令。相比 `ls -l`,它提供更全面的信息,包括文件大小、权限、所有者、时间戳(最后访问、修改、状态变更时间)、inode 号、设备信息等。其常用选项包括 `-f` 查看文件系统状态、`-t` 以简洁格式输出、`-L` 跟踪符号链接,以及 `-c` 或 `--format` 自定义输出格式。通过这些选项,用户可以灵活获取所需信息,适用于系统调试、权限检查、磁盘管理等场景。
288 137
|
2月前
|
安全 Ubuntu Unix
一、初识 Linux 与基本命令
玩转Linux命令行,就像探索一座新城市。首先要熟悉它的“地图”,也就是/根目录下/etc(放配置)、/home(住家)这些核心区域。然后掌握几个“生存口令”:用ls看周围,cd去别处,mkdir建新房,cp/mv搬东西,再用cat或tail看文件内容。最后,别忘了随时按Tab键,它能帮你自动补全命令和路径,是提高效率的第一神器。
659 57
|
5月前
|
JSON 自然语言处理 Linux
linux命令—tree
tree是一款强大的Linux命令行工具,用于以树状结构递归展示目录和文件,直观呈现层级关系。支持多种功能,如过滤、排序、权限显示及格式化输出等。安装方法因系统而异常用场景包括:基础用法(显示当前或指定目录结构)、核心参数应用(如层级控制-L、隐藏文件显示-a、完整路径输出-f)以及进阶操作(如磁盘空间分析--du、结合grep过滤内容、生成JSON格式列表-J等)。此外,还可生成网站目录结构图并导出为HTML文件。注意事项:使用Tab键补全路径避免错误;超大目录建议限制遍历层数;脚本中推荐禁用统计信息以优化性能。更多详情可查阅手册mantree。
491 143
linux命令—tree
|
1月前
|
存储 安全 Linux
Linux卡在emergency mode怎么办?xfs_repair 命令轻松解决
Linux虚拟机遇紧急模式?别慌!多因磁盘挂载失败。本文教你通过日志定位问题,用`xfs_repair`等工具修复文件系统,三步快速恢复。掌握查日志、修磁盘、验重启,轻松应对紧急模式,保障系统稳定运行。
369 2
|
2月前
|
缓存 监控 Linux
Linux内存问题排查命令详解
Linux服务器卡顿?可能是内存问题。掌握free、vmstat、sar三大命令,快速排查内存使用情况。free查看实时内存,vmstat诊断系统整体性能瓶颈,sar实现长期监控,三者结合,高效定位并解决内存问题。
250 0
Linux内存问题排查命令详解
|
2月前
|
Unix Linux 程序员
Linux文本搜索工具grep命令使用指南
以上就是对Linux环境下强大工具 `grep` 的基础到进阶功能介绍。它不仅能够执行简单文字查询任务还能够处理复杂文字处理任务,并且支持强大而灵活地正则表达规范来增加查询精度与效率。无论您是程序员、数据分析师还是系统管理员,在日常工作中熟练运用该命令都将极大提升您处理和分析数据效率。
258 16
|
4月前
|
监控 Linux 网络安全
Linux命令大全:从入门到精通
日常使用的linux命令整理
803 13