数据结构与算法—哈夫曼树详解与构造

简介: 给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。

介绍



定义


  • 给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。


20190901000614257.png


简而言之,就是按照一个贪心思想和规则进行树的构造,而构造出来的这个树的权值最小!


其中WPL表示计算出的权值。至于为什么按照哈夫曼树方法构造得到的权重最小。这里不进行证明。对于哈夫曼树,他的每个非叶子节点都有两个孩子因为哈夫曼树的构造就是自底向上的构造,两两合并。


WPL计算方法:

WPL=求和(wi li)其中wi是第i个节点的权值(value)。li是第i个节点的长(深)度.


哈夫曼树的构造



初始时候各个数直都是一个单节点森林!然后进行排序。


20190901122238469.png


放入优先队列(自己排序也行)每次取两个最小权值顶点,构造父节点(value=left.value+right.value).


  • 如果队列为空,那么返回节点,并且这个节点为根节点root。


20190901123458351.png


否则继续加入队列进行排序。重复上述操作,直到队列为空


20190901124045504.png


  • 在计算带权路径长度的时候,需要重新计算树的高度(从下往上),因为哈夫曼树是从下往上构造的,所以对于高度不太好维护,可以构造好然后计算高度。


比如上述的WPL为:2*3+3*3+6*2+8*2+9*2=(2+3)*3+(6+8+9)*2=61.


代码实现:



package 二叉树;
import java.util.ArrayDeque;
import java.util.ArrayList;
import java.util.Comparator;
import java.util.List;
import java.util.PriorityQueue;
import java.util.Queue;
public class HuffmanTree {  
  public static class node
  {
    int value;
    node left;
    node right;
    int deep;//记录深度
    public node(int value) {
      this.value=value;
      this.deep=0;
    }
    public node(node n1, node n2, int value) {
      this.left=n1;
      this.right=n2;
      this.value=value;
    }
  }
  private node root;//最后生成的根节点
  List<node>nodes;
  public HuffmanTree() {
    this.nodes=null;
  }
  public HuffmanTree(List<node>nodes)
  {
    this.nodes=nodes;
  }
  public void createTree() {
     Queue<node>q1=new PriorityQueue<node>(new Comparator<node>() {
    public int compare(node o1, node o2) {
      return o1.value-o2.value;
    }});
     q1.addAll(nodes);
     while(!q1.isEmpty())
     {
       node n1=q1.poll();
       node n2=q1.poll();
      node parent=new node(n1,n2,n1.value+n2.value);
      if(q1.isEmpty())
      {
        root=parent;return;
      }
      q1.add(parent);
     }
  }
  public int getweight() {
    Queue<node>q1=new ArrayDeque<node>();
    q1.add(root);
    int weight=0;
    while (!q1.isEmpty()) {
      node va=q1.poll();
      if(va.left!=null)
      {
        va.left.deep=va.deep+1;va.right.deep=va.deep+1;
        q1.add(va.left);q1.add(va.right);
      }
      else {
        weight+=va.deep*va.value;
      }
    }
    return weight;
  }
  public static void main(String[] args) {
    List<node>list=new ArrayList<node>();
    list.add(new node(2));
    list.add(new node(3));
    list.add(new node(6));
    list.add(new node(8));list.add(new node(9));
    HuffmanTree tree=new HuffmanTree();
    tree.nodes=list;
    tree.createTree();
    System.out.println(tree.getweight());
  }
}


20190901124937258.png


哈夫曼树还是比较容易理解,主要构造利用贪心算法的思想。代码实现复杂度可能不太高,如果有大佬指正还希望指正!


如果对数据结构,爬虫等感兴趣,还请关注我的公众号:bigsai.一起学习交流!


目录
相关文章
|
存储 算法 C语言
C语言---数据结构实验---哈夫曼树及哈夫曼编码的算法实现---图的基本操作
C语言---数据结构实验---哈夫曼树及哈夫曼编码的算法实现---图的基本操作
|
4月前
|
存储 C语言
数据结构基础详解(C语言): 树与二叉树的应用_哈夫曼树与哈夫曼曼编码_并查集_二叉排序树_平衡二叉树
本文详细介绍了树与二叉树的应用,涵盖哈夫曼树与哈夫曼编码、并查集以及二叉排序树等内容。首先讲解了哈夫曼树的构造方法及其在数据压缩中的应用;接着介绍了并查集的基本概念、存储结构及优化方法;随后探讨了二叉排序树的定义、查找、插入和删除操作;最后阐述了平衡二叉树的概念及其在保证树平衡状态下的插入和删除操作。通过本文,读者可以全面了解树与二叉树在实际问题中的应用技巧和优化策略。
|
5月前
|
算法 C++
第一周算法设计与分析 E : 构造回文串
这篇文章介绍了解决算法问题"构造回文串"的方法,即判断给定的整数N(视为字符串)是否可以通过在前面添加任意个0(或不添加)来构造一个回文串,并给出了相应的C++代码实现。
|
7月前
|
算法 C++
算法与数据结构高手养成:朴素的贪心法(中)构造法
算法与数据结构高手养成:朴素的贪心法(中)构造法
46 2
|
7月前
|
机器学习/深度学习 存储
数据结构学习记录——哈夫曼树(什么是哈夫曼树、哈夫曼树的定义、哈夫曼树的构造、哈夫曼树的特点、哈夫曼编码)
数据结构学习记录——哈夫曼树(什么是哈夫曼树、哈夫曼树的定义、哈夫曼树的构造、哈夫曼树的特点、哈夫曼编码)
222 1
|
7月前
|
设计模式 Java C++
数据结构篇:数据拷贝、深拷贝、重载与移动构造
数据结构篇:数据拷贝、深拷贝、重载与移动构造
33 0
|
8月前
|
编译器
【数据结构】哈夫曼树编译码器【课程设计】
【数据结构】哈夫曼树编译码器【课程设计】
|
存储 算法
数据结构实验十二 哈夫曼树及编码
数据结构实验十二 哈夫曼树及编码
105 0
|
8月前
|
算法 Java
数据结构-构造哈夫曼树【详解+代码+图示】一文解惑!
数据结构-构造哈夫曼树【详解+代码+图示】一文解惑!
3531 0
|
算法
代码随想录算法训练营第十八天 | 力扣 513. 找树左下角的值、112. 路径总和、113. 路径总和 II、106. 从中序与后序遍历序列构造二叉树、105. 从前序与中序遍历序列构造二叉树
代码随想录算法训练营第十八天 | 力扣 513. 找树左下角的值、112. 路径总和、113. 路径总和 II、106. 从中序与后序遍历序列构造二叉树、105. 从前序与中序遍历序列构造二叉树
59 0