利用Python浅尝算法分析

简介: 学习编程的人或许都听说过,程序 = 数据结构 + 算法 .数据是程序的中心,算法是解决问题的步骤,数据结构和算法两个概念间的逻辑关系贯穿了整个程序世界,首先二者表现为不可分割的关系.没有数据间的有机关系,程序根本无法设计。数据结构是底层,算法是上层。数据结构为算法提供服务,算法围绕数据结构进行操作这些概念较为抽象,我们浅尝辄止,本文只介绍一些简单的理论,我们平时练习的程序可能运算规模和数据规模都很小每次运行都能很快得出结果,可以说是秒出.因为现在计算机技术的快速发展,就算是个人计算机一样有这非常可观的算力.但是这并不能改变运行程序时消耗资源的事实.在实际的开发中,无论是设计还是应用一种算法

引言


学习编程的人或许都听说过,程序 = 数据结构 + 算法 .数据是程序的中心,算法是解决问题的步骤,数据结构和算法两个概念间的逻辑关系贯穿了整个程序世界,首先二者表现为不可分割的关系.没有数据间的有机关系,程序根本无法设计。数据结构是底层,算法是上层。数据结构为算法提供服务,算法围绕数据结构进行操作

这些概念较为抽象,我们浅尝辄止,本文只介绍一些简单的理论,我们平时练习的程序可能运算规模和数据规模都很小每次运行都能很快得出结果,可以说是秒出.因为现在计算机技术的快速发展,就算是个人计算机一样有这非常可观的算力.但是这并不能改变运行程序时消耗资源的事实.


在实际的开发中,无论是设计还是应用一种算法,我们都要了解这种算法的性能如何,通常我们在衡量一个算法的性能时关心的是对CPU和内存的使用率,但是CPU是计算机中最为珍贵的资源,我们还是以CPU的使用率为主,它体现在算法上就是算法的运算速度,用一个专业的描述就是算法的时间复杂度.相应,如果要计算的是程序运行需要的空间需要考虑的就是空间复杂度.作为上层的使用者我们更关心是时间复杂度,时间越快越好,但是资源开销的成本来看,我们会平衡时间和空间进行取舍.


什么是时间复杂度


不同机器运算速度不一样,我们如何统一衡量一个算法的执行时间呢?计算机科学家们想到,可以用计算步骤来称量。我们所说的算法时间复杂度一般就是指解决问题所执行的语句频数.即算法从开始执行到执行完毕所需要的步骤数量。说通俗点,就是计算程序运行步骤次数的最高阶.由于并不是每个算法都能上机测试,而且现实中也没有太大的必要,我们一般需要分析得出大致计算所需要的资源,才会上机,而不是盲目上机测试.说白了.我们使用算法中语句的执行次数对算法进行估算,哪个算法中语句执行次数多,它花费的时间就多,同时我们通常将算法中的语句执行次数称为时间频度,记为T(n),n表示的是语句的规模


什么是大O表示法


有了T(n)之后,还有一个问题就是我们不知道随着处理数据的的增长他的变化会呈现出什么规律,因此引入辅助函数f(n)的概念,他和T(n)是同一个量级的,使用符号O(f(n))来替代T(n).O(f(n))这种形式也称为大O表示法.这样我们可以使用函数分析的手段较为准确地分析时间频度T(n),并以此来计算时间复杂度


大O表示法的规则


有些运行处理对于当前的算法来说影响很小,几乎可以忽略不计.

大O表示法的简单规则如下:

  1. 常数项使用O(1)表示
  2. 高阶因子和低阶因子并存,只保留高阶因子
  3. 如果高阶因子项存在并且不是常数项,则去除系数

对与上面的描述你可能还有一点一知半解,那我们就通过例子来唠一唠


算法分析的简单小实例:


常数阶:比如我们平时一些简单的赋值.简单的四则运行

a=2b=5c=0.5*a*bprint(c)


上面的例子所有语句最高阶是1,是常数级的.所以他们整体就是常数级的,所以他的时间复杂度就是常数阶用O(1)表示;不管这样的语句有多少条,时间复杂度也不会变,在算法中常数阶也是运行速度最快的


线性阶:简单理解就是可能涉及到单层循环


foriinrange(n):
print('hello!')


因为循环体中的时间复杂度为O(1)常数阶的代码执行了n次,这段代码的规模就是由n的大小决定的.所以它的时间复杂度为O(n)


平方阶:简单理解是在线性阶的基础上由多加了一层循环


foriinrange(n):
forjinrange(m):
print('你好')

在这段代码中最里层代码依然是常数阶,常数阶外面为两层循环,内层循环的频数是由外层决定的,所以,它的时间复杂度不能简单地设为n^2.但是我们可以对其进行推导,代码中输出语句执行的次数为:n+(n-1)+(n-2)+······+1这是一个等差数列,由等差数列公式可得该式为n^2+n/2.根据上文中大O表示法的第2和3条规则可得出最高阶为n^2,所以上面代码的时间复杂度为O(n^2)


常见时间复杂度的比较


下面分别从简单的例子列举中了解常用的算法复杂度:

O(1):从一个数据集中获取第一个元素


l= [1,2,3,4]
first=l[0]
print(first)

O(log n):将数据集分为两堆,然后将分好的部分再分半,以此类推(二分法)

defbinary_search(list, item):
low=0high=len(list)-1n=0whilelow<=high:
mid=int((low+high)/2)              
guess=list[mid]
n+=1iflist[mid]==item:
print(n)
returnmidiflist[mid]<item:                    
low=mid+1else:
high= (mid-1)
returnNonel=[1,2,3,4,8,9,11,12,14,18,19,20,28]
print(binary_search(l,12))


O(n):遍历一个数据集

l= [1,2,3,4]
foriinl:
print(i)


O(n log n):给数据生成所有的排列组合同时遍历分出来的每一半数据

O(n^2)平方级:遍历一个数据集中的每个元素的同时遍历另一个同数量级的数据集

O(2^n)指数级:为一个数据集生成其可能的所有子集

O(n!)阶乘级:给数据集生成所有的排列组合

唠一唠:你那些常用的算法都分别对应着上面的哪种时间复杂度呢?

目录
相关文章
|
9天前
|
数据采集 缓存 定位技术
网络延迟对Python爬虫速度的影响分析
网络延迟对Python爬虫速度的影响分析
|
6天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
27 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
6天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
21 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
6天前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
25 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
10天前
|
算法 Python
在Python编程中,分治法、贪心算法和动态规划是三种重要的算法。分治法通过将大问题分解为小问题,递归解决后合并结果
在Python编程中,分治法、贪心算法和动态规划是三种重要的算法。分治法通过将大问题分解为小问题,递归解决后合并结果;贪心算法在每一步选择局部最优解,追求全局最优;动态规划通过保存子问题的解,避免重复计算,确保全局最优。这三种算法各具特色,适用于不同类型的问题,合理选择能显著提升编程效率。
28 2
|
11天前
|
数据采集 存储 JSON
Python爬虫开发中的分析与方案制定
Python爬虫开发中的分析与方案制定
|
18天前
|
数据可视化 开发者 Python
Python GUI开发:Tkinter与PyQt的实战应用与对比分析
【10月更文挑战第26天】本文介绍了Python中两种常用的GUI工具包——Tkinter和PyQt。Tkinter内置于Python标准库,适合初学者快速上手,提供基本的GUI组件和方法。PyQt基于Qt库,功能强大且灵活,适用于创建复杂的GUI应用程序。通过实战示例和对比分析,帮助开发者选择合适的工具包以满足项目需求。
62 7
|
17天前
|
存储 数据处理 Python
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第27天】在科学计算和数据分析领域,Python凭借简洁的语法和强大的库支持广受欢迎。NumPy和SciPy作为Python科学计算的两大基石,提供了高效的数据处理和分析工具。NumPy的核心功能是N维数组对象(ndarray),支持高效的大型数据集操作;SciPy则在此基础上提供了线性代数、信号处理、优化和统计分析等多种科学计算工具。结合使用NumPy和SciPy,可以显著提升数据处理和分析的效率,使Python成为科学计算和数据分析的首选语言。
27 3
|
18天前
|
存储 机器学习/深度学习 算法
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第26天】NumPy和SciPy是Python科学计算领域的两大核心库。NumPy提供高效的多维数组对象和丰富的数学函数,而SciPy则在此基础上提供了更多高级的科学计算功能,如数值积分、优化和统计等。两者结合使Python在科学计算中具有极高的效率和广泛的应用。
33 2
|
19天前
|
算法 测试技术 开发者
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗;代码审查通过检查源代码发现潜在问题,提高代码质量和团队协作效率。本文介绍了一些实用的技巧和工具,帮助开发者提升开发效率。
20 3