前言
在我们电脑中怎样去存储数据?
简单来说,内存和磁盘都是电脑存储数据的两个核心介质。不同在于,数据结构是在内存中管理数据。速度快,带电存储。数据库是在磁盘上管理数据。速度慢,不带电存储。永久保存,磁盘上的简单数据 都存储到文件中,复杂的文件 都存储到数据库中。数据库也是对数据的增删查改等功能实现。
什么时候需要在内存底下管理数据和在磁盘底下管理数据呢?
举个例子,当我们电脑打开微信,我们需要增删查改的信息时,这些信息都是存储在我们电脑的内存上的,磁盘上是找不到这些人的信息的。那为什么我们关闭电脑再次打开,这些信息还是存在呢?
打开微信------>根据信息管理特征(群名/分组)------>拉取腾讯服务器的上的信息------->根据数据结构将信息临时存放到我们的电脑内存上。永久存储其实是在腾讯的服务器上的磁盘上。
为什么不会存储在我们的磁盘上?
因为磁盘运行的速度太慢。不方便增删查改。
在前面的C语言学习中,我们写的通讯录就是包含顺序表/数组的数据结构,后面我们还会去学习链表/数/图/哈希表,
什么是数据结构?
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。
什么是算法?
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
【数据结构算法】非常重要,我们一起好好学习!
学好算法对一个程序员来说是必须的吗?如果是,至少应该学到哪种程度? - 知乎 (zhihu.com)
【数据结构和算法书籍的推荐】:《剑指offer》和《程序员代码面试指南》。和【力扣】上面的题目认真的去做一做。
算法的复杂度(算法效率)
如何去衡量一个算法的好坏?
在C语言中我们学习了递归。比如用递归实现斐波那契数列:
long long Fib(int N) { if(N < 3) return 1; return Fib(N-1) + Fib(N-2); }
斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?
这时,我们引入一个【算法复杂度】的概念:
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。 所以,在实际中我们谈论较多就是时间复杂度,即程序运行的效率和速度。
算法的时间复杂度
传统意义上,我们会觉得时间复杂度就是 不同的程序去实现需求 所需要的不同的S秒数。但是实际上,我们去比较S秒数,这是不科学和不准确的。
一个程序在不同的电脑上运行的时间是不同的,运行的S秒数取决于电脑的硬件。例如一个i7 32G的电脑和i3 4G的电脑,运行的S秒数肯定是不同的。没有一个标准去比较。
时间复杂度概念
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。
一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。这个分析方式和机器的硬件是无关的。
一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度
大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
- 用常数1取代运行时间中的所有加法常数。所有常数都是O(N)
- 在修改后的运行次数函数中,只保留最高阶项。取决定性的项。用极限的思维去考虑。
- 如果最高阶项存在且不是1,则去除与这个项目相乘的常数。去掉系数
- 【预期管理法】另外有些算法的时间复杂度存在最好、平均和最坏情况
- 最坏情况:任意输入规模的最大运行次数(上界)
- 平均情况:任意输入规模的期望运行次数
- 最好情况:任意输入规模的最小运行次数(下界)
- 在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
- 特别提醒:双层嵌套循环不一定是O(N^2),根据思想来求时间复杂度。
- 根据不同的思想求各自的时间复杂度,找到最优的,再写代码。
常见的时间复杂度计算示例
根据代码来计算
示例1
请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N) { int count = 0; for (int i = 0; i < N; ++i) { for (int j = 0; j < N; ++j) { ++count; } } for (int k = 0; k < 2 * N; ++k) { ++count; } int M = 10; while (M--) { ++count; } printf("%d\n", count); }
实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用【大O的渐进表示法】。
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。
示例2
计算Func2的时间复杂度?
void Func2(int N) { int count = 0; for (int k = 0; k < 2 * N; ++k) { ++count; } int M = 10; while (M--) { ++count; } printf("%d\n", count); }
示例3
计算Func3的时间复杂度?
void Func3(int N, int M) { int count = 0; for (int k = 0; k < M; ++k) { ++count; } for (int k = 0; k < N; ++k) { ++count; } printf("%d\n", count); }
示例4
计算Func4的时间复杂度?
void Func4(int N) { int count = 0; for (int k = 0; k < 100; ++k) { ++count; } printf("%d\n", count); }
- O(1)并不是代表1次,代表的是常数次。
示例5
计算strchr的时间复杂度?
const char * strchr ( const char * str, int character );
根据思想来计算
示例6
计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n) { assert(a); for (size_t end = n; end > 0; --end) { int exchange = 0; for (size_t i = 1; i < end; ++i) { if (a[i - 1] > a[i]) { Swap(&a[i - 1], &a[i]); exchange = 1; } } if (exchange == 0) break; } }
看到上面的代码,可能是毫不犹豫的O(N^2),为什么?两层循环?两层循环就一定是O(N^2)了吗?其实不是。从这里开始就要学会:从解题思想上去算时间复杂度了。
时间复杂度计算不能数代码中循环的层数。要根据思想,灵活计算。
我们再来看一个例子。
这是快速排序中的一步。思想根据:把小于keyi的放在keyi的左边,大于keyi的放在keyi的右边。
看了上面快速排序的两个循环我们发现:两层循环不一定是O(N^2)。
上面的代码根据思想来看:就是left和right一起把数组遍历了一遍,所以时间复杂度是O(N)。
时间复杂度的OJ练习题
【单生狗1】
一个数组中只有一个数字出现一次,其他所有数字都是成对出现。编写一个函数找出这个数字。
【方法1】暴力求解:统计每个元素出现的次数,然后找出只出现一次的。
【方法2】异或
异或操作符:相同为0,相异为1
- a^a=0
- a^0=a
- a^b^a=a^a^b=b(异或支持交换律)
#include<stdio.h> int main() { int arr[] = { 1,2,3,4,5,6,1,2,3,4,5 }; int sz = sizeof(arr) / sizeof(arr[0]); int i = 0; int ret = 0; for (i = 0; i < sz; i++) { ret ^= arr[i]; } printf("%d ", ret); return 0; }
【单生狗2】
一个数组中只有两个数字出现一次,其他所有数字都出现了两次。编写一个函数找出这两个只出现一次的数字。
【方法1】暴力求解
【方法2】分组异或
分组:把两个单生狗分为两组,再利用单生狗1异或的方法分别求解。
- 先数组全部元素异或到一起得到的结果就是两个单生狗异或的结果。
- 两个单生狗异或的结果一定不为0,根据相同为0,相异为1的原理,结果中二进制位一定有1
- 选择为1的位数,来进行分组,这样就可以不同的两个单生狗放到不同的分组里面了
- 只要异或之后的结果为1的位数,就可以拿来分组
- &1 == 1此位为1 &1 == 0 此位为0
- 全部异或到一起,得到r
- 计算r是第几位是1,得到位数i---从最低位开始判断是否为1,不是往左移动1为>>1----&1
- 以第i位来分组
- 在分别异或到一起得到单生狗
#include<stdio.h> int main() { int arr[] = { 1,2,3,4,6,1,2,3,4,5 };//5 6 int sz = sizeof(arr) / sizeof(arr[0]); int i = 0; int ret = 0; //1.全部^到一起 for (i = 0; i < sz; i++) { ret ^= arr[i]; } //2.找到为1的n位 int n = 0;//n是为1的位数 for (n = 0; n < 32; n++)//4个字节32个bite位 { if (((ret>>n) & 1 )== 1) { break;//n是移动几位,第几位 } } //3.分组 int r1 = 0; int r2 = 0; for (i = 0; i < sz; i++) { if (((arr[i] >> n)&1) == 1) { r1 ^= arr[i]; } if (((arr[i] >> n) & 1) == 0) { r2 ^= arr[i]; } } printf("r1=%d r2=%d\n", r1, r2); //返回下标 int j = 0; for (j = 0; j < sz; j++) { if (arr[j] == r1) printf("r1下标:%d\n", j); if (arr[j] == r2) printf("r2下标:%d\n", j); } return 0; } //封装成函数-----想把两个单身狗带回-----用指针 //返回下标-----------遍历一遍
【消失的数字】
数组
nums
包含从0
到n
的所有整数,但其中缺了一个。请编写代码找出那个缺失的整数。你有办法在O(n)时间内完成吗?动手写一写。
【方法1】暴力求解:先冒泡排序,再遍历一遍,当 当前值+1 不等于下一个值 这就是消失的数字
- 冒泡排序时间复杂:O(N^2) 遍历时间复杂度:O(N) 。 时间复杂度:O(N^2)
【方法2】异或:和上面单生狗的思想是一样的。
- 第一个循环时间复杂度:O(N) 第二个循环时间复杂度: O(N+1) 时间复杂度:O(N)
int missingNumber(int* nums, int numsSize){ int ret=0; int i=0; for(i=0;i<numsSize;i++)//先把数组全部数组异或 0~N缺少一个数字所以是N+1-1个数字即N个数字 { ret^=nums[i]; } for(i=0;i<=numsSize;i++)//得到的结果再次异或0~N数字 0~N有N+1个数字 { ret^=i; } return ret; }
【方法3】等差数列公式计算:0~N等差数列公式计算和,再一次减去数组中的元素,剩下的就是消失的数字。
- 等差数列时间复杂度:O(1) 循环时间复杂度:O(N) 时间复杂度:O(N)
特别提醒:0~N有N+1项
【方法4】简单的哈希:动态内存开辟一个N空间大小的数组,放入0~N的数字,和缺失元素的数组比较,比较之后就找到缺失的元素了。
✔✔✔✔✔最后,感谢大家的阅读,若有错误和不足,欢迎指正!之后就开始数据结构初阶篇的学习。初阶数据结构都是用C语言来学习,学习初阶数据结构要求是:指针/结构/动态内存管理等。在下一篇我们会去讲解到更多题目和空间复杂度。
代码---------→【唐棣棣 (TSQXG) - Gitee.com】
联系---------→【邮箱:2784139418@qq.com】