C语言实现通用数据结构的高效设计

简介:

  近期在阅读一个开源的C++代码。里面用到了大量的STL里面的东西。或许是自己一直用C而非常少用C++来实现算法的原因。STL里面大量的模板令人心烦。一直对STL的效率表示怀疑,但在网上搜到这样一个帖子,说C的标准库里面高速排序比STL的标准排序要慢!于是,便认真的看了下二者的源代码,发现C++里面的std::sort综合运用了部分高速排序和堆排序算法,而C标准库里面用的是通用数据结构的高速排序,C标准库里面的qsort之所以比std::sort慢。是由于C语言中为了适配全部的数据结构使用了空指针。以下以更为简单的插入排序为例说明这个问题。


插入排序的算法实现代码:

void insert_sort(int a[], int n)  
{  
	int i, j;  
	int t;
	for (i = 1; i < n; i++) {
		t = a[i];
		j = i;
		while ((j > 0) && (a[j - 1] > t)) {
			a[j] = a[j - 1];
			j--;
		}
		a[j] = t;
	}
}  

        上述插入排序的实现仅仅能针对整数类型进行排序,假设数据类型是浮点型。则要自己又一次把代码拷贝一份。而且更改函数名以及数据类型。

假设是双精度的,又或者是对自己定义的结构体数组进行排序呢? 显然,这不是一种非常好的解决方式。 而用空指针能够解决问题。

通用数据类型的插入排序实现代码:

void general_insert_sort(void* arr, int num_element, int element_bytes, int (*cmp_fun)(void* p1, void* p2))  
{  
	int i, j;  
	int t[1024];
	if (element_bytes > 4096){
		return;
	}
#define ELE(arr, i) (void*)(((unsigned)arr) + (i) * element_bytes)
	for (i = 1; i < num_element; i++) {
		memcpy(t, ELE(arr, i), element_bytes);
		j = i;
		while ((j > 0) && (cmp_fun(ELE(arr, j - 1), (void*)t))) {
			memcpy(ELE(arr, j), ELE(arr, j - 1), element_bytes);
			j--;
		}
		memcpy(ELE(arr, j), (void*)t, element_bytes);
	}
} 

        上述通用插入排序的实现有一个限制。就是待排序数组里面每个元素的大小不能超过4k,当然对于简单的系统提前定义好的数据类型,数组元素的大小最大为double,仅仅有8个字节,这是远远的足够用的。假设你自己定义的结构体的大小太大,比如大于这里设置的4K,则没有必要用此方法排序,由于此时数据移动会占用大部分时间,此时应该考虑用索引排序的方法。

       上面的方法尽管攻克了随意数据类型的问题,可是其效率并不怎么高。相对于上述第一段代码而言,简单的赋值语句必须得调用一个函数来拷贝数据。简单的比較语句,则须要调用外部传入一个函数指针得到比較结果。

这是效率低下的根本原因。

       而C++模板參数的出现,仅仅须要写一份代码,编译器依据你调用时候的数据类型自己主动生成新的代码。其有用宏也能够完毕通用的功能。这里给出C语言宏的代码。C++模板的代码也非常easy。


#define FIV_IMPLEMENT_INSETT_SORT(function_name, T, LT_CMP)\
void function_name(T* arr, int low, int high)\
{\
	int i, j;\
	T t;\
	for (i = low + 1; i < high; i++) {\
		t = arr[i];\
		j = i;\
		while ((j > low) && (LT_CMP(t, arr[j - 1]))) {\
			arr[j] = arr[j - 1];\
			j--;\
		}\
		arr[j] = t;\
	}\
} 

上面的宏定义能够看做是一种模板定义,能够用于随意数据类型。

假设你要对整数进行排序。非常easy,用以下的两个宏。一个宏定义比較运算。一个宏为函数定义:

#define  CMP(a, b)    ((a) < (b))
FIV_IMPLEMENT_INSETT_SORT(insert_sort_int, int, CMP)

这样就有一个用于整数排序的函数insert_sort_int可用,假设是你自己定义的结构体类型,则相同仅仅须要写这两个宏就能够了。


结尾:


用C++模板产生的代码大小是不使用模板的非常多倍,而用C语言的空指针能够支持随意数据类型,代码大小非常小,而用C语言的宏定义产生模板函数的代码大小理论上和使用STL的大小是一样的。

经过本人測试。随便一个特定数据结构的高速排序递归实现,都比c++ stl里面的std::sort要快








本文转自mfrbuaa博客园博客,原文链接:http://www.cnblogs.com/mfrbuaa/p/5126167.html,如需转载请自行联系原作者


相关文章
|
4月前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
142 1
|
4月前
|
存储 算法 搜索推荐
【趣学C语言和数据结构100例】91-95
本文涵盖多个经典算法问题的C语言实现,包括堆排序、归并排序、从长整型变量中提取偶数位数、工人信息排序及无向图是否为树的判断。通过这些问题,读者可以深入了解排序算法、数据处理方法和图论基础知识,提升编程能力和算法理解。
93 4
|
4月前
|
存储 机器学习/深度学习 搜索推荐
【趣学C语言和数据结构100例】86-90
本文介绍并用C语言实现了五种经典排序算法:直接插入排序、折半插入排序、冒泡排序、快速排序和简单选择排序。每种算法都有其特点和适用场景,如直接插入排序适合小规模或基本有序的数据,快速排序则适用于大规模数据集,具有较高的效率。通过学习这些算法,读者可以加深对数据结构和算法设计的理解,提升解决实际问题的能力。
70 4
|
4月前
|
存储 算法 数据处理
【趣学C语言和数据结构100例】81-85
本文介绍了五个经典算法问题及其C语言实现,涵盖图论与树结构的基础知识。包括使用BFS求解单源最短路径、统计有向图中入度或出度为0的点数、统计无向无权图各顶点的度、折半查找及二叉排序树的查找。这些算法不仅理论意义重大,且在实际应用中极为广泛,有助于提升编程能力和数据结构理解。
72 4
|
4月前
|
算法 数据可视化 数据建模
【趣学C语言和数据结构100例】76-80
本文介绍了五种图论算法的C语言实现,涵盖二叉树的层次遍历及广度优先搜索(BFS)和深度优先搜索(DFS)的邻接表与邻接矩阵实现。层次遍历使用队列按层访问二叉树节点;BFS利用队列从源节点逐层遍历图节点,适用于最短路径等问题;DFS通过递归或栈深入图的分支,适合拓扑排序等场景。这些算法是数据结构和算法学习的基础,对提升编程能力和解决实际问题至关重要。
79 4
|
4月前
|
存储 算法 vr&ar
【趣学C语言和数据结构100例】71-75
本文介绍了五个C语言数据结构问题及其实现,涵盖链表与二叉树操作,包括按奇偶分解链表、交换二叉树左右子树、查找节点的双亲节点、计算二叉树深度及求最大关键值。通过递归和遍历等方法,解决了理论与实际应用中的常见问题,有助于提升编程能力和数据结构理解。
69 4
|
4月前
|
存储 算法 C语言
【趣学C语言和数据结构100例】66-70
本书《趣学C语言和数据结构100例》精选了5个典型的数据结构问题及C语言实现,涵盖链表与数组操作,如有序集合的集合运算、有序序列表的合并、数组中两顺序表位置互换、三递增序列公共元素查找及奇偶数重排。通过详细解析与代码示例,帮助读者深入理解数据结构与算法设计的核心思想,提升编程技能。
59 4
|
4月前
|
存储 算法 C语言
【趣学C语言和数据结构100例】51-55
本文介绍了五个关于链表操作的C语言实现案例,包括删除单链表中的重复元素、从两个有序链表中查找公共元素、判断一个链表是否为另一链表的连续子序列、判断循环双链表是否对称及合并两个循环单链表。每个案例都详细解析了算法思路与实现方法,涵盖了链表操作的多种场景,旨在帮助读者深入理解链表数据结构的应用,提升算法设计与编程能力。
64 4
|
1月前
|
定位技术 C语言
c语言及数据结构实现简单贪吃蛇小游戏
c语言及数据结构实现简单贪吃蛇小游戏
|
2月前
|
搜索推荐 C语言
数据结构(C语言)之对归并排序的介绍与理解
归并排序是一种基于分治策略的排序算法,通过递归将数组不断分割为子数组,直到每个子数组仅剩一个元素,再逐步合并这些有序的子数组以得到最终的有序数组。递归版本中,每次分割区间为[left, mid]和[mid+1, right],确保每两个区间内数据有序后进行合并。非递归版本则通过逐步增加gap值(初始为1),先对单个元素排序,再逐步扩大到更大的区间进行合并,直至整个数组有序。归并排序的时间复杂度为O(n*logn),空间复杂度为O(n),且具有稳定性,适用于普通排序及大文件排序场景。