Java实现Tire

简介:

Trie,又称单词查找树或键树,是一种树形结构。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。

它有3个基本性质:

  • 根节点不包含字符,除根节点外每一个节点都只包含一个字符。
  • 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
  • 每个节点的所有子节点包含的字符都不相同。

下面这个图就是Trie的表示,每一条边表示一个字符,如果结束,就用星号表示。在这个Trie结构里,我们有下面字符串,比如do, dork, dorm等,但是Trie里没有ba, 也没有sen,因为在a, 和n结尾,没有结束符号(星号)。

有了这样一种数据结构,我们可以用它来保存一个字典,要查询改字典里是否有相应的词,是否非常的方便呢?我们也可以做智能提示,我们把用户已经搜索的词存在Trie里,每当用户输入一个词的时候,我们可以自动提示,比如当用户输入 ba, 我们会自动提示 bat 和 baii.

现在来讨论Trie的实现。

首先,我们定义一个Abstract Trie,Trie 里存放的是一个Node。这个类里有两个操作,一个是插入,另一个是查询。具体实现放在后面。

实现                                                                                            

Node类:

复制代码
package com.yydcdut;

import java.util.LinkedList;

public class Node {
    char content; //装node中的内容
    boolean isEnd; //是否是单词的结尾
    int count;  //这个单词的这个字母下面分支的个数
    LinkedList<Node> childList; //子list
    /**
     * 构造函数
     * @param c 单词的字母
     */
    public Node(char c){  
        childList = new LinkedList<Node>();  
        isEnd = false;  
        content = c;  
        count = 0;  
    }   
    /**
     * 遍历一下这个node中LinkedList中是否有这个字母,有就意味着可以继续查找下去,没有就没有。
     * @param c 单词的字母
     * @return 如果有的话就返回下一个node,没有的话就返回null
     */
    public Node subNode(char c){  
        if(childList != null){  
            for(Node eachChild : childList){  
                if(eachChild.content == c){  
                    return eachChild;  
                }  
            }  
        }  
        return null;  
    }  
}
复制代码

具体实现:

复制代码
package com.yydcdut;

public class Main {
    
    private Node root; //
    /**
     * 构造函数,生成根   
     */
    public Main(){  
        root = new Node(' ');   
    }  
    /**
     * 插入函数,先判断是否有这个单词了(通过每个单词字母来判断),如果没有,挨着顺序判断是否有这个字母了,
     *如果有这个字幕,继续判断下一个,当没有这个字母的时候,对这个字母new一个node对象,放入到上一个字母的
     *LinkedList里面       
     * @param word 要插入的单词
     */
    public void insert(String word){  
        //如果找到就返回
        if(search(word) == true) return;  
          
        Node current = root;   
        for(int i = 0; i < word.length(); i++){  
            Node child = current.subNode(word.charAt(i));  
            if(child != null){   
                current = child;  
            } else {  
                 current.childList.add(new Node(word.charAt(i)));  
                 current = current.subNode(word.charAt(i));  
            }
            //单词下面分支数++
            current.count++;  
        }   
        //在单词最后字母那里结束了
        current.isEnd = true;  
    }  
    /**
     * 查找函数,判断是否已经有隔着单词了
     * @param word 要判断的单词
     * @return 有这个单词返回true,没有返回false
     */
    public boolean search(String word){  
        Node current = root;  
          
        for(int i = 0; i < word.length(); i++){      
            if(current.subNode(word.charAt(i)) == null)  
                return false;  
            else  
                current = current.subNode(word.charAt(i));  
        }  
        //判断这个单词的这个字母是否在字典里面结束了
        if (current.isEnd == true) return true;  
        else return false;  
    }  
    /**
     * 删除函数,先判断是否存在这个单词,不存在就跳出,存在就删除掉,每个单词的count都要减1  
     * @param word 要删除的单词
     */
    public void deleteWord(String word){  
        if(search(word) == false) return;  
      
        Node current = root;  
        for(char c : word.toCharArray()) {   
            Node child = current.subNode(c);  
            if(child.count == 1) {  
                current.childList.remove(child);  
                return;  
            } else {  
                child.count--;  
                current = child;  
            }  
        }  
        current.isEnd = false;  
    }  

    public static void main(String[] args) {
        Main trie = new Main();  
        trie.insert("ball");  
        trie.insert("balls");  
        trie.insert("sense");      
 
        System.out.println(trie.search("balls"));  
        System.out.println(trie.search("ba"));  
        
        trie.deleteWord("balls");  
        System.out.println(trie.search("balls"));  
        System.out.println(trie.search("ball"));  

    }

}
复制代码

时间复杂度分析:

对于insert, 如果被插入的String长度是 k, 每对一个字符进行查询,我们最多在child linkedlist里面查询26次(最多26个字母),所以,复杂度为O(26*k) = O(k). 对于 search, 复杂度是一样的。

我是天王盖地虎的分割线                                                                 

源代码:http://pan.baidu.com/s/1dD1Qx01

trie.zip




本文转自我爱物联网博客园博客,原文链接:http://www.cnblogs.com/yydcdut/p/3846441.html,如需转载请自行联系原作者

相关文章
|
小程序 Java
Java实现多线程
Java实现多线程
47 0
|
1月前
|
Java API Spring
Java实现异步编程的几种方式
通过本文的介绍,我们了解了在Java中实现异步编程的几种常用方式。每种方法都有其优点和适用场景,具体选择哪种方式应根据实际需求和场景决定。如果任务较简单,可以使用 `Thread`或 `ExecutorService`;如果需要处理复杂的异步流程,可以考虑使用 `CompletableFuture`或Reactive编程框架。希望本文对您理解和实现Java异步编程有所帮助。
44 1
|
前端开发 JavaScript Java
java实现文件对比
基于java实现类似于svn的文件对比功能及效果,该对比适用于html,js,css,text等
java实现文件对比
|
存储 算法 Java
Java实现—数据结构 1.初识集合框架
Java实现—数据结构 1.初识集合框架
63 0
|
搜索推荐 算法 Java
【算法】Shell排序的原理与Java实现
Shell排序,也称为希尔排序(Shell Sort),是一种改进的插入排序算法。它通过将待排序的数组分割成多个较小的子数组,对这些子数组进行插入排序,最后再对整个数组进行一次插入排序。希尔排序的核心思想是通过较大的间隔比较和交换元素,使得数组中的元素能够快速地朝最终位置前进,从而提高插入排序的效率。
93 0
|
Java
Java实现图形打印
Java实现图形打印
206 0
|
存储 Java
【Java原理探索】「TreeMap」原理和基础源码的介绍
【Java原理探索】「TreeMap」原理和基础源码的介绍
79 0
【Java原理探索】「TreeMap」原理和基础源码的介绍
|
Java
Java实现多线程的两种方式
run():封装线程执行的代码,直接调用,相当于普通方法的调用
137 0
Java实现多线程的两种方式
|
搜索推荐 算法 Java
基本排序算法总结(Java实现)
排序概念就是将一串记录按照其中某个或某些关键字的大小,递增或递减的排列起来的操作。
基本排序算法总结(Java实现)
|
机器学习/深度学习 Java
Java实现尺取法
Java实现尺取法