字典树详解

简介: 字典树,顾名思义,是关于“字典”的一棵树。即:它是对于字典的一种存储方式(所以是一种数据结构而不是算法)。

概念

字典树,顾名思义,是关于“字典”的一棵树。即:它是对于字典的一种存储方式(所以是一种数据结构而不是算法)。这个词典中的每个“单词”就是从根节点出发一直到某一个目标节点的路径,路径中每条边的字母连起来就是一个单词。

2345_image_file_copy_24.jpg

标橙色的节点是“目标节点“,即根节点到这个目标节点的路径上的所有字母构成了一个单词。

从这张图我们可以看出,字典树就是一棵树(emm…有些废话的嫌疑),只不过,这棵树的每条边上都有一个字母,然后这棵树的一些节点被指定成了标记节点(目标节点)而已。

这就是字典树的概念。结合上面说的概念,上图所示的字典树包括的单词分别为:

a abc bac bbc ca

功能

根据字典树的概念,我们可以发现:字典树的本质是把很多字符串拆成单个字符的形式,以树的方式存储起来。所以我们说字典树维护的是”字典“。那么根据这个最基本的性质,我们可以由此延伸出字典树的很多妙用。简单总结起来大体如下:

1.维护字符串集合(即字典)。

2.向字符串集合中插入字符串(即建树)。

3.查询字符串集合中是否有某个字符串(即查询)。

4.统计字符串在集合中出现的个数(即统计)。

5.将字符串集合按字典序排序(即字典序排序)。

6.求集合内两个字符串的LCP(Longest Common Prefix,最长公共前缀)(即求最长公共前缀)。

我们可以发现,以上列举出的功能都是建立在“字符串集合”的基础上的。再一次强调,字典树是“字典”的树,一切功能都是“字典”的功能。这也为我们使用字典树的时候提供了一个准则:看到一大堆字符串同时出现,就往哈希和Trie树那边想一下。

实现

基本树结构

其中count表示以当前单词结尾的单词数量。

prefix表示以该处节点之前的字符串为前缀的单词数量。

class TrieNode:
    def __init__(self):
        self.count = 0
        self.prefix = 0
        self.nextNode = [None] * 26

插入新节点

好比假设有b,abc,abd,bcd,abcd,efg,hii 这6个单词,那我们创建trie树就得到

2345_image_file_copy_26.jpg

# 插入一个新单词
  # root为根节点, s为要加入的字符串
    def insert(self, root, s):
      # 预处理
        if root is None or len(s) == 0:
            return
        # 将字符串转化为字符数组
        temp = list(s)
        # 构建和维护树
        for i in range(len(s)):
          # 如果没有该节点,新加一个节点
            if root.nextNode[ord(temp[i]) - ord('a')] is None:
                root.nextNode[ord(temp[i]) - ord('a')] = TrieNode()
            root = root.nextNode[ord(temp[i]) - ord('a')]
            # 前缀数加1
            root.prefix += 1
        # 最后count加1
        root.count += 1

创建和维护一个字典树就完成了,下面的操作大同小异了。

查找(统计)

# 查找该单词是否存在,如果存在返回数量,不存在返回-1
    def search(self, root, s):
        if root is None or len(s) == 0:
            return -1
        temp = list(s)
        for i in range(len(s)):
            if root.nextNode[ord(temp[i]) - ord('a')] is None:
                return -1
            root = root.nextNode[ord(temp[i]) - ord('a')]
        if root.count == 0:
            return -1
        return root.count

查询以str为前缀的单词数量

 # 查询以str为前缀的单词数量
    def searchPrefix(self, root, s):
        if root is None or len(s) == 0:
            return -1
        temp = list(s)
        for i in range(len(s)):
            if root.nextNode[ord(temp[i]) - ord('a')] is None:
                return -1
            root = root.nextNode[ord(temp[i]) - ord('a')]
        return root.prefix

主函数测试

if __name__ == '__main__':
    newNode = TrieNode()
    newNode.insert(newNode, 'hello')
    newNode.insert(newNode, 'hello')
    newNode.insert(newNode, 'helloword')
    print(newNode.search(newNode, 'hello'))
    print(newNode.searchPrefix(newNode, 'he'))
目录
相关文章
|
自然语言处理 Python
Python:ULID通用唯一词典排序标识符
Python:ULID通用唯一词典排序标识符
437 0
|
PHP 开发工具
PHP对接苹果支付全流程
PHP对接苹果支付全流程
1720 0
PHP对接苹果支付全流程
“Could not find suitable distribution for Requirement.parse(‘XXXX‘)”的问题
“Could not find suitable distribution for Requirement.parse(‘XXXX‘)”的问题
607 0
|
5月前
|
Ubuntu 定位技术
Ubuntu 20.04应用部署:Beyond Compare 4.4.7安装教程
这样,你就成功在Ubuntu 20.04上安装了Beyond Compare 4.4.7。就像一个探险者,你有了罗盘,有了地图,熟能生巧,你就可以在未知的世界中探索,发现,享受这个过程。这是一次成功的探险,你做得很好!
648 7
|
9月前
|
NoSQL Java 中间件
【📕分布式锁通关指南 02】基于Redis实现的分布式锁
本文介绍了从单机锁到分布式锁的演变,重点探讨了使用Redis实现分布式锁的方法。分布式锁用于控制分布式系统中多个实例对共享资源的同步访问,需满足互斥性、可重入性、锁超时防死锁和锁释放正确防误删等特性。文章通过具体示例展示了如何利用Redis的`setnx`命令实现加锁,并分析了简化版分布式锁存在的问题,如锁超时和误删。为了解决这些问题,文中提出了设置锁过期时间和在解锁前验证持有锁的线程身份的优化方案。最后指出,尽管当前设计已解决部分问题,但仍存在进一步优化的空间,将在后续章节继续探讨。
1225 131
【📕分布式锁通关指南 02】基于Redis实现的分布式锁
|
5月前
|
人工智能 自然语言处理 算法
AI时代如何让大模型「读懂」企业数据?——从“单一问数”到“复杂决策”的智能跃迁
从早期的传统BI,到敏捷BI,再到智能BI,BI工具正逐步进化为具备类人推理能力的数字助手。Gartner预测,到2025年,增强型消费者体验将首次推动增强型BI(ABI)能力的采用率超过50%,这将深刻重塑企业的业务流程与决策模式,“人人都是数据消费者”的时代正加速到来。
python项目 以docker形式打包部署全流程
在很久很久以前,我已经听过Docker的大名,当时服务着急上线虽然考虑过用Docker来部署我的服务,但是因为赶期的原因放弃了。 这两天因为华为云服务器到期,而且阿里云服务器优惠力度特别大的原因,我要把华为云服务器里的工程迁移到阿里云。 迁移的过程中,大量的时间精力浪费在了重装python,加载依赖,迁移项目,配置端口等环境配置的工作上。 我在想,如果当时用了Docker部署,我至于受这气?
|
Java 数据库连接 数据库
告别繁琐 SQL!Hibernate 入门指南带你轻松玩转 ORM,解锁高效数据库操作新姿势
【8月更文挑战第31天】Hibernate 是一款流行的 Java 持久层框架,简化了对象关系映射(ORM)过程,使开发者能以面向对象的方式进行数据持久化操作而无需直接编写 SQL 语句。本文提供 Hibernate 入门指南,介绍核心概念及示例代码,涵盖依赖引入、配置文件设置、实体类定义、工具类构建及基本 CRUD 操作。通过学习,你将掌握使用 Hibernate 简化数据持久化的技巧,为实际项目应用打下基础。
902 0
|
Prometheus 监控 Cloud Native
搭建服务端性能监控系统 Prometheus 详细指南
搭建Prometheus监控系统,涉及Ubuntu上Docker的安装,通过`docker run`命令启动Prometheus容器,并挂载配置文件。配置文件默认示例可以从GitHub获取,调整`scrape_interval`和`targets`以监控Prometheus自身及Node Exporter(提供系统指标)。Node Exporter以Docker容器形式运行在9100端口。完成配置后,重启Prometheus容器,通过Web界面查看监控数据。后续将介绍结合Grafana进行可视化。
|
负载均衡 Java 调度
Java中的定时任务实现详解
Java中的定时任务实现详解