学弟学妹们，学会霍夫曼编码后，再也不用担心网络带宽了！(2)-阿里云开发者社区

学弟学妹们，学会霍夫曼编码后，再也不用担心网络带宽了！(2)

2021-12-03 131

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 学弟学妹们，学会霍夫曼编码后，再也不用担心网络带宽了！

当树构建完毕后，我们来统计一下要发送的比特数。

1）来看字符这一列。四个字符 A、B、C、D 共计 4*8=32 比特。每个英文字母均占用一个字节，即 8 个比特。

2）来看频率这一列。A 5 次，B 1 次，C 6 次，D 3 次，一共 15 比特。

3）来看编码这一列。A 的编码为 11，对应霍夫曼树上的 15→9→5，也就是说，从根节点走到叶子节点 A，需要经过 11 这条路径；对应的 B 需要走过 100 这条路径；对应的 D 需要走过 101 这条路径；对应的 C 需要走过 0 这条路径。

4）来看长度这一列。A 的编码为 11，出现了 5 次，因此占用 10 个比特，即 1111111111；B 的编码为 100，出现了 1 次，因此占用 3 个比特，即 100；C 的编码为 0，出现了 6 次，因此占用 6 个比特，即 000000；D 的编码为 101，出现了 3 次，因此占用 9 个比特，即 101101101。

哈夫曼编码从本质上讲，是将最宝贵的资源（最短的编码）给出现概率最多的数据。在上面的例子中，C 出现的频率最高，它的编码为 0，就省下了不少空间。

结合生活中的一些情况想一下，也是这样，我们把最常用的放在手边，这样就能提高效率，节约时间。所以，我有一个大胆的猜想，霍夫曼就是这样发现编码的最优解的。

在没有经过霍夫曼编码之前，字符串“BCAADDDCCACACAC”的二进制为：

10000100100001101000001010000010100010001000100010001000100001101000011010000010100001101000001010000110100000101000011

也就是占了 120 比特。

编码之后为：

0000001001011011011111111111

占了 28 比特。

但考虑到解码，需要把霍夫曼树的结构也传递过去，于是字符占用的 32 比特和频率占用的 15 比特也需要传递过去。总体上，编码后比特数为 32 + 15 + 28 = 75，比 120 比特少了 45 个，效率还是非常高的。

关于霍夫曼编码的 Java 示例，我在这里也贴出来一下，供大家参考。

class HuffmanNode {
    int item;
    char c;
    HuffmanNode left;
    HuffmanNode right;
}
class ImplementComparator implements Comparator<HuffmanNode> {
    public int compare(HuffmanNode x, HuffmanNode y) {
        return x.item - y.item;
    }
}
public class Huffman {
    public static void printCode(HuffmanNode root, String s) {
        if (root.left == null && root.right == null && Character.isLetter(root.c)) {
            System.out.println(root.c + "   |  " + s);
            return;
        }
        printCode(root.left, s + "0");
        printCode(root.right, s + "1");
    }
    public static void main(String[] args) {
        int n = 4;
        char[] charArray = { 'A', 'B', 'C', 'D' };
        int[] charfreq = { 5, 1, 6, 3 };
        PriorityQueue<HuffmanNode> q = new PriorityQueue<HuffmanNode>(n, new ImplementComparator());
        for (int i = 0; i < n; i++) {
            HuffmanNode hn = new HuffmanNode();
            hn.c = charArray[i];
            hn.item = charfreq[i];
            hn.left = null;
            hn.right = null;
            q.add(hn);
        }
        HuffmanNode root = null;
        while (q.size() > 1) {
            HuffmanNode x = q.peek();
            q.poll();
            HuffmanNode y = q.peek();
            q.poll();
            HuffmanNode f = new HuffmanNode();
            f.item = x.item + y.item;
            f.c = '-';
            f.left = x;
            f.right = y;
            root = f;
            q.add(f);
        }
        System.out.println(" 字符 | 霍夫曼编码 ");
        System.out.println("--------------------");
        printCode(root, "");
    }
}

本例的输出结果如下所示：

字符 | 霍夫曼编码

--------------------

C | 0

B | 100

D | 101

A | 11

给大家留个作业题吧，考虑一下霍夫曼编码的时间复杂度，知道的学弟学妹可以在留言区给出答案哈。

学弟学妹们，学会霍夫曼编码后，再也不用担心网络带宽了！(2)

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

学弟学妹们，学会霍夫曼编码后，再也不用担心网络带宽了！(2)

热门文章

最新文章

相关课程

相关电子书

相关实验场景