c语言数据结构-哈夫曼树

简介: c语言数据结构-哈夫曼树

(创作不易,感谢有你,你的支持,就是我前行的最大动力,如果看完对你有帮助,请留下您的足迹)

目录

哈夫曼树的定义

构造哈夫曼树

编码过程


哈夫曼树的定义

假设有 m个权值 {𝒘1 ,𝒘 2,  ··· , 𝒘 m } 可以构造一棵含n个叶子结点的二叉树,每个叶子结点的权为𝒘 𝒊 ,则其中带权路径长度 WPL最下的二叉树称作最优二叉树或哈夫曼树  

路径:a→b的路径:a→ 𝒘 2 、 𝒘 2 → 𝒘 𝟐 、 𝒘 1 → 𝒘 3 、 𝒘 𝟒 → 𝐛

路径长度:a→b的路径长度:4

树的路径长度:从树根到每一结点的路径长度之和

权:对实体的某个或某些属性的数值化描述

结点的带权路径长度为从该结点到树根之间的路径长度与结点上权的乘积

数的带权路径长度为树中所有叶子结点的带权路径长度之和

/** Huffman树结点 */
typedef struct haffNode {
    char data;                      //用来存放字符的数据域
    int weight;                     //权重
    struct haffNode* leftChild;    //左孩子
    struct haffNode* rightChild;   //右孩子
}HaffNode;
/**以顺序结构存储的树结点,依次构建编码解码的字符映射表 */
HaffNode node[MAX_SIZE];

构造哈夫曼树

1.根据给定的n个权值{w 1 ,w 2 ,……w n },构造n棵只有根结点的二叉树。

2.在森林中选取两棵根结点权值最小的树作左右子树,构造一棵新的二叉树,置新二叉树根

  结点权值为其左右子树根结点权值之和。

3.在森林中删除这两棵树,同时将新得到的二叉树加入森林中。

重复上述两步,直到只含一棵树为止,这棵树即哈夫曼树。

/** 用来保存左子树结点 */
HaffNode left[HALF_MAX];
/** 用来保存右子树结点 */
HaffNode right[HALF_MAX];
/** 冒泡排序:以权值大小降序 */
void SortHaffman(HaffNode* node, int length) 
{
    HaffNode tempNode;
    for (int i = 0; i < length - 1; i++)
    {
        for (int j = 0; j < length - i - 1; j++)
        {
            //权值小的结点后移
            if (node[j].weight < node[j + 1].weight)
            {
                tempNode = node[j];
                node[j] = node[j + 1];
                node[j + 1] = tempNode;
            }
        }
    }
}
/**
 * 构造赫夫曼树
 *  node 赫夫曼树的结点数组
 *  length 结点数组的长度
 */
void CreateHaffman(HaffNode* node, int length)
{
    if (length <= 1)
        return;                 //数组长度为1时结束递归
    SortHaffman(node, length);              //将结点数组按weight(权)从大到小排列
    //构建一个以末尾两个结点为左右子结点的父节点,该父节点的权值为两个子结点权值之和
    HaffNode parent;
    //因为排过序了,所以最后一个结点[length-1]的权值肯定最小
    left[length] = node[length - 1];        //权值第二小的结点在左
    right[length] = node[length - 2];       //权值最小的结点在右
    parent.weight = left[length].weight + right[length].weight; //父节点权值为左右结点权值之和
    parent.leftChild = &left[length];       //左子树
    parent.rightChild = &right[length];     //右子树
    //将倒数第二位替换为该父节点,长度-1,递归创建赫夫曼树
    node[length - 2] = parent;
    CreateHaffman(node, length - 1);
}

编码过程

分解接收的字符串:遇“0”向左,遇“1”向右;一旦到达叶子结点,则译出一个字符,反复由根触发,直到译码完成。

特点:每一码都不是另一码的前缀,绝对不会错译

/**
 * 编码过程(压缩过程)
 * @param node 结点数组
 * @param keepCode 返回存储编码后的字符数组
 * @param index 当前操作的字符数组下标
 */
void Coding(HaffNode* node, char* keepCode, int index) {
    if (!node) return;
    //处理叶结点
    if (node->leftChild == NULL || node->rightChild == NULL) {
        //给编码数组设置一个终止符,形成一个完整的字符串,方便拷贝(防止拷贝到之前的编码)
        keepCode[index] = '\0';
        //node->data-0是char型转int型的简便方法
        strcpy(code[node->data - 0], keepCode);
        return;
    }
    //左分支编码为'0', 右分支编码为'1'
    keepCode[index] = '0';
    Coding(node->leftChild, keepCode, index + 1);
    keepCode[index] = '1';
    Coding(node->rightChild, keepCode, index + 1);
}


相关文章
|
27天前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
41 1
|
1月前
|
存储 算法 搜索推荐
【趣学C语言和数据结构100例】91-95
本文涵盖多个经典算法问题的C语言实现,包括堆排序、归并排序、从长整型变量中提取偶数位数、工人信息排序及无向图是否为树的判断。通过这些问题,读者可以深入了解排序算法、数据处理方法和图论基础知识,提升编程能力和算法理解。
49 4
|
1月前
|
存储 机器学习/深度学习 搜索推荐
【趣学C语言和数据结构100例】86-90
本文介绍并用C语言实现了五种经典排序算法:直接插入排序、折半插入排序、冒泡排序、快速排序和简单选择排序。每种算法都有其特点和适用场景,如直接插入排序适合小规模或基本有序的数据,快速排序则适用于大规模数据集,具有较高的效率。通过学习这些算法,读者可以加深对数据结构和算法设计的理解,提升解决实际问题的能力。
45 4
|
1月前
|
存储 算法 数据处理
【趣学C语言和数据结构100例】81-85
本文介绍了五个经典算法问题及其C语言实现,涵盖图论与树结构的基础知识。包括使用BFS求解单源最短路径、统计有向图中入度或出度为0的点数、统计无向无权图各顶点的度、折半查找及二叉排序树的查找。这些算法不仅理论意义重大,且在实际应用中极为广泛,有助于提升编程能力和数据结构理解。
44 4
|
1月前
|
算法 数据可视化 数据建模
【趣学C语言和数据结构100例】76-80
本文介绍了五种图论算法的C语言实现,涵盖二叉树的层次遍历及广度优先搜索(BFS)和深度优先搜索(DFS)的邻接表与邻接矩阵实现。层次遍历使用队列按层访问二叉树节点;BFS利用队列从源节点逐层遍历图节点,适用于最短路径等问题;DFS通过递归或栈深入图的分支,适合拓扑排序等场景。这些算法是数据结构和算法学习的基础,对提升编程能力和解决实际问题至关重要。
52 4
|
1月前
|
存储 算法 vr&ar
【趣学C语言和数据结构100例】71-75
本文介绍了五个C语言数据结构问题及其实现,涵盖链表与二叉树操作,包括按奇偶分解链表、交换二叉树左右子树、查找节点的双亲节点、计算二叉树深度及求最大关键值。通过递归和遍历等方法,解决了理论与实际应用中的常见问题,有助于提升编程能力和数据结构理解。
41 4
|
1月前
|
存储 算法 C语言
【趣学C语言和数据结构100例】66-70
本书《趣学C语言和数据结构100例》精选了5个典型的数据结构问题及C语言实现,涵盖链表与数组操作,如有序集合的集合运算、有序序列表的合并、数组中两顺序表位置互换、三递增序列公共元素查找及奇偶数重排。通过详细解析与代码示例,帮助读者深入理解数据结构与算法设计的核心思想,提升编程技能。
36 4
|
28天前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
54 5
|
27天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
61 1
|
1月前
|
存储 机器学习/深度学习 算法
【趣学C语言和数据结构100例】61-65
本文介绍了五个关于C语言和数据结构的经典问题及其实现方法,涵盖查找链表共同后缀、删除重复节点、重新排列链表元素、合并有序链表以及特定条件下的链表排序。每个问题通过具体的算法设计,不仅展示了链表操作的灵活性,还强调了效率优化的重要性。通过这些问题的探讨,读者可以深入理解链表的基本操作和高级应用,提升解决实际问题的能力。
52 4

热门文章

最新文章