C++实现树 - 06 哈夫曼树编码

简介: 这一讲我们来学习一个比较有趣的树 —— 哈夫曼树,在许多非常知名的算法里也出现了哈夫曼树,这一讲我们就好好来唠唠什么是哈夫曼树。
写在前面:
这一讲我们来学习一个比较有趣的树 —— 哈夫曼树,在许多非常知名的算法里也出现了哈夫曼树,这一讲我们就好好来唠唠什么是哈夫曼树。

前置概念

概念一:什么是结点路径的长度

从根结点到该结点的路径上的连接数。
在这里插入图片描述
例如上图(下面将会用到),从结点 28 到结点 2 的连接数为 3 。

概念二:什么是树的路径长度

就是树的每个叶子结点的路径长度之和,上图的树的路径长度就为 3 + 3 + 3 + 3 + 1 = 13 。

概念三:什么是结点的带权路径长度

结点的路径长度与结点权值的乘积。

概念四:什么是树的带权路径长度 WPL

就是树的所有叶子结点的带权路径长度之和。

应用场景

在数据膨胀、信息爆炸的今天,数据压缩的意义不言而喻。谈到数据压缩,就不能不提赫夫曼(Huffman)编码,赫夫曼编码是首个实用的压缩编码方案,即使在今天的许多知名压缩算法里,依然可以见到赫夫曼编码的影子。

另外,在数据通信中,用二进制给每个字符进行编码时不得不面对的⼀个问题是如何使电稳总长最短且不产生二义性。根据字符出现频率,利用赫夫曼编码可以构造出一种不等长的二进制,使编码后的电文长度最短,且保证不产生二义性。

当有了以上概念以后,我们就可以用WPL去判断一颗二叉树的性能。WPL的值越小,二叉树的性能越优。

哈夫曼树的构造

(1)给出我们要构造的结点权值。
在这里插入图片描述
(2)找出两个最小的权值,创建双亲结点,并且其权值等于这两个最小的权值结点之和。将这两个结点移出后续的大小判断,并将新创建的结点加入后续的大小判断。
在这里插入图片描述
(3)不断地重复上述操作。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

//找到两个最小的权值(这里为了方便大家理解,就分开找两个最小值了)
void select(HuffmanTree huffmanTree[], int n, int &s1, int &s2) {
    int min;
    //遍历全部的结点,找出一个单结点
    for (int i = 1; i <= n; i++) {
        if (huffmanTree[i].parent == 0) {
            min = i;
            break;
        }
    }
    //继续遍历全部结点,找出权值最小的单结点
    for (int i = 1; i <= n; i++) {
        if (huffmanTree[i].parent == 0) {
            if (huffmanTree[i].weight < huffmanTree[min].weight) {
                min = i;
            }
        }
    }
    s1 = min;
    //进行和上面相同的操作,找到第二小的结点
    for (int i = 1; i <= n; i++) {
        if (huffmanTree[i].parent == 0 && i != s1) {
            min = i;
            break;
        }
    }
    for (int i = 1; i <= n; i++) {
        if (huffmanTree[i].parent == 0 && i != s1) {
            if (huffmanTree[i].weight < huffmanTree[min].weight) {
                min = i;
            }
        }
    }
    s2 = min;
}

//构建哈夫曼树
void createHuffmanTree(int w[], int n) {
    int s1;
    int s2;
    int m = 2 * n - 1;
    //1--n号空间存放叶子结点,初始化结点
    for (int i = 1; i <= n; i++) {
        //其中叶子结点的权值是w[n]数组保存
        huffmanTree[i].weight = w[i];
        huffmanTree[i].lChild = 0;
        huffmanTree[i].rChild = 0;
        huffmanTree[i].parent = 0;
    }
    //对于其它的结点即非叶子结点
    for (int i = n + 1; i <= m; i++) {
        huffmanTree[i].weight = w[i];
        huffmanTree[i].lChild = 0;
        huffmanTree[i].rChild = 0;
        huffmanTree[i].parent = 0;
    }

    //创建非叶子结点,构建哈夫曼树
    for (int i = n + 1; i <= m; i++) {
        //找到权值最小的两个结点,分别赋值给s1和s2
        select(huffmanTree, i - 1, s1, s2);
        huffmanTree[s1].parent = i;
        huffmanTree[s2].parent = i;
        huffmanTree[i].lChild = s1;
        huffmanTree[i].rChild = s2;
        huffmanTree[i].weight = huffmanTree[s1].weight + huffmanTree[s2].weight;
    }
}

哈弗曼编码

我们将结点到其左孩子的路径上标记为 0 ,将结点到其右孩子的路径上标记为 1 ,这样就可以得到一个编码树。
在这里插入图片描述
通过上述操作,就可以得到每个结点对应的编码,结果如下:

  • 2:0 0 0
  • 3:0 0 1
  • 4:0 1 0
  • 4:0 1 1(这里权值为 4 的结点有两个)
  • 15:1

通过观察可以发现,每个结点的编码都具有前缀性,即没有任何编码是其他编码的前缀,也就是说每一个叶子结点不能出现在到另一个叶子结点的路径上。

//从n个叶子结点到根求哈弗曼编码
void creatHuffmanCode(int n) {
    string *huffmanCode = new string[n + 1];    //创建一个储存编码的数组
    for (int i = 1; i <= n; i++) {
        string cd = "";
        //这里我们从叶子结点开始向上遍历
        for (int c = i, p = huffmanTree[i].parent; p != 0; c = p, p = huffmanTree[p].parent) {
            if (huffmanTree[p].lChild == c) {
                cd = "0" + cd;    //如果该结点是双亲结点的左孩子,则在编码前加‘0’
            } else {
                cd = "1" + cd;    //如果该结点是双亲结点的右孩子,则在编码前加‘1’
            }
        }
        huffmanCode[i] = cd;
    }
    //输出编码
    for (int i = 1; i <= n; i++) {
        cout << huffmanTree[i].weight << " " << huffmanCode[i] << endl;
    }
}

全部代码

#include <bits/stdc++.h>
using namespace std;

struct HuffmanTree {
    int weight;    //权值
    int lChild;    //左孩子
    int rChild;    //右孩子
    int parent;    //双亲结点
};

HuffmanTree *huffmanTree = NULL;
void createHuffmanTree(int[], int);
void creatHuffmanCode(int);

int main() {
    int n;
    int w[1000];
    cin >> n;
    for (int i = 1; i <= n; i++) {
        cin >> w[i];
    }
    int m = 2 * n - 1;
    huffmanTree = new HuffmanTree[m + 1];
    createHuffmanTree(w, n);
    creatHuffmanCode(n);
}

//找到两个最小的权值(这里为了方便大家理解,就分开找两个最小值了)
void select(HuffmanTree huffmanTree[], int n, int &s1, int &s2) {
    int min;
    //遍历全部的结点,找出一个单结点
    for (int i = 1; i <= n; i++) {
        if (huffmanTree[i].parent == 0) {
            min = i;
            break;
        }
    }
    //继续遍历全部结点,找出权值最小的单结点
    for (int i = 1; i <= n; i++) {
        if (huffmanTree[i].parent == 0) {
            if (huffmanTree[i].weight < huffmanTree[min].weight) {
                min = i;
            }
        }
    }
    s1 = min;
    //进行和上面相同的操作,找到第二小的结点
    for (int i = 1; i <= n; i++) {
        if (huffmanTree[i].parent == 0 && i != s1) {
            min = i;
            break;
        }
    }
    for (int i = 1; i <= n; i++) {
        if (huffmanTree[i].parent == 0 && i != s1) {
            if (huffmanTree[i].weight < huffmanTree[min].weight) {
                min = i;
            }
        }
    }
    s2 = min;
}

//构建哈夫曼树
void createHuffmanTree(int w[], int n) {
    int s1;
    int s2;
    int m = 2 * n - 1;
    //1--n号空间存放叶子结点,初始化结点
    for (int i = 1; i <= n; i++) {
        //其中叶子结点的权值是w[n]数组保存
        huffmanTree[i].weight = w[i];
        huffmanTree[i].lChild = 0;
        huffmanTree[i].rChild = 0;
        huffmanTree[i].parent = 0;
    }
    //对于其它的结点即非叶子结点
    for (int i = n + 1; i <= m; i++) {
        huffmanTree[i].weight = w[i];
        huffmanTree[i].lChild = 0;
        huffmanTree[i].rChild = 0;
        huffmanTree[i].parent = 0;
    }

    //创建非叶子结点,构建哈夫曼树
    for (int i = n + 1; i <= m; i++) {
        //找到权值最小的两个结点,分别赋值给s1和s2
        select(huffmanTree, i - 1, s1, s2);
        huffmanTree[s1].parent = i;
        huffmanTree[s2].parent = i;
        huffmanTree[i].lChild = s1;
        huffmanTree[i].rChild = s2;
        huffmanTree[i].weight = huffmanTree[s1].weight + huffmanTree[s2].weight;
    }
}

//从n个叶子结点到根求哈弗曼编码
void creatHuffmanCode(int n) {
    string *huffmanCode = new string[n + 1];    //创建一个储存编码的数组
    for (int i = 1; i <= n; i++) {
        string cd = "";
        //这里我们从叶子结点开始向上遍历
        for (int c = i, p = huffmanTree[i].parent; p != 0; c = p, p = huffmanTree[p].parent) {
            if (huffmanTree[p].lChild == c) {
                cd = "0" + cd;    //如果该结点是双亲结点的左孩子,则在编码前加‘0’
            } else {
                cd = "1" + cd;    //如果该结点是双亲结点的右孩子,则在编码前加‘1’
            }
        }
        huffmanCode[i] = cd;
    }
    //输出编码
    for (int i = 1; i <= n; i++) {
        cout << huffmanTree[i].weight << " " << huffmanCode[i] << endl;
    }
}

如果大家有什么问题的话,欢迎在下方评论区进行讨论哦~

目录
相关文章
|
11天前
|
存储 C++
【C++数据结构——树】哈夫曼树(头歌实践教学平台习题) 【合集】
【数据结构——树】哈夫曼树(头歌实践教学平台习题)【合集】目录 任务描述 相关知识 测试说明 我的通关代码: 测试结果:任务描述 本关任务:编写一个程序构建哈夫曼树和生成哈夫曼编码。 相关知识 为了完成本关任务,你需要掌握: 1.如何构建哈夫曼树, 2.如何生成哈夫曼编码。 测试说明 平台会对你编写的代码进行测试: 测试输入: 1192677541518462450242195190181174157138124123 (用户分别输入所列单词的频度) 预
49 14
【C++数据结构——树】哈夫曼树(头歌实践教学平台习题) 【合集】
|
11天前
|
Java C++
【C++数据结构——树】二叉树的基本运算(头歌实践教学平台习题)【合集】
本关任务:编写一个程序实现二叉树的基本运算。​ 相关知识 创建二叉树 销毁二叉树 查找结点 求二叉树的高度 输出二叉树 //二叉树节点结构体定义 structTreeNode{ intval; TreeNode*left; TreeNode*right; TreeNode(intx):val(x),left(NULL),right(NULL){} }; 创建二叉树 //创建二叉树函数(简单示例,手动构建) TreeNode*create
36 12
|
11天前
|
C++
【C++数据结构——树】二叉树的性质(头歌实践教学平台习题)【合集】
本文档介绍了如何根据二叉树的括号表示串创建二叉树,并计算其结点个数、叶子结点个数、某结点的层次和二叉树的宽度。主要内容包括: 1. **定义二叉树节点结构体**:定义了包含节点值、左子节点指针和右子节点指针的结构体。 2. **实现构建二叉树的函数**:通过解析括号表示串,递归地构建二叉树的各个节点及其子树。 3. **使用示例**:展示了如何调用 `buildTree` 函数构建二叉树并进行简单验证。 4. **计算二叉树属性**: - 计算二叉树节点个数。 - 计算二叉树叶子节点个数。 - 计算某节点的层次。 - 计算二叉树的宽度。 最后,提供了测试说明及通关代
37 10
|
12天前
|
存储 算法 测试技术
【C++数据结构——树】二叉树的遍历算法(头歌教学实验平台习题) 【合集】
本任务旨在实现二叉树的遍历,包括先序、中序、后序和层次遍历。首先介绍了二叉树的基本概念与结构定义,并通过C++代码示例展示了如何定义二叉树节点及构建二叉树。接着详细讲解了四种遍历方法的递归实现逻辑,以及层次遍历中队列的应用。最后提供了测试用例和预期输出,确保代码正确性。通过这些内容,帮助读者理解并掌握二叉树遍历的核心思想与实现技巧。
36 2
|
2月前
|
存储 C++
【C++】AVL树
AVL树是一种自平衡二叉搜索树,由Georgy Adelson-Velsky和Evgenii Landis提出。它通过确保任意节点的两子树高度差不超过1来维持平衡,支持高效插入、删除和查找操作,时间复杂度为O(log n)。AVL树通过四种旋转操作(左旋、右旋、左-右旋、右-左旋)来恢复树的平衡状态,适用于需要频繁进行数据操作的场景。
75 2
|
4月前
|
存储 C++
【C++】AVL树
AVL树是一种自平衡二叉搜索树:它以苏联科学家Georgy Adelson-Velsky和Evgenii Landis的名字命名。
45 2
|
5月前
|
C++ 容器
【C++航海王:追寻罗杰的编程之路】关联式容器的底层结构——AVL树
【C++航海王:追寻罗杰的编程之路】关联式容器的底层结构——AVL树
55 5
|
5月前
|
存储 算法 C++
【C++】C++ QT实现Huffman编码器与解码器(源码+课程论文+文件)【独一无二】
【C++】C++ QT实现Huffman编码器与解码器(源码+课程论文+文件)【独一无二】
153 4
|
6月前
|
C++
【C++】手撕AVL树(下)
【C++】手撕AVL树(下)
66 1
|
6月前
|
Java C++ Python
【C++】手撕AVL树(上)
【C++】手撕AVL树(上)
67 0