算法分析 | 第一套(渐近分析)

简介: 算法分析 | 第一套(渐近分析)

为什么要进行性能分析?


有很多重要的事情应该注意,比如用户友好性、模块化、安全性、可维护性等。 为什么要担心性能?

答案很简单,只有我们有性能,我们才能拥有上述所有东西。所以性能就像货币,我们可以通过它购买上述所有东西。

总而言之,性能 == 规模。想象一个可以加载 1000 页的文本编辑器,但每分钟可以拼写检查 1 页,或者一个需要 1 小时将图像向左旋转 90 度的图像编辑器。如果一个软件功能不能应付用户需要执行的任务的规模,那它就像挂了一样。

给定一个任务的两种算法,我们如何找出哪个更好?

一种比较天真的方法是:实现这两种算法并在您的计算机上针对不同的输入运行这两个程序,然后看看哪一个花费的时间更少。这种用于分析算法的方法存在许多问题。


  1. 对于某些输入,第一种算法的性能可能优于第二种算法。对于某些输入,第二个表现更好。
  2. 也有可能对于某些输入,第一种算法在一台机器上表现更好,而第二种算法在其他机器上对其他一些输入效果更好。

渐近分析是在分析算法中处理上述问题的大思想。在渐近分析中,我们根据输入大小来评估算法的性能(我们不测量实际运行时间)。我们计算,算法占用的时间(或空间)如何随着输入大小而增加。


例如,让我们考虑排序数组中的搜索问题(搜索给定项目)。一种搜索方式是线性搜索(增长顺序是线性的),另一种方式是二分搜索(增长顺序是对数)。


为了理解渐近分析如何解决上述分析算法中的问题,假设我们在快速计算机A上运行线性搜索,在慢速计算机B上运行二进制搜索,我们为两台计算机选择常数值,以便它准确地告诉我们给定机器在几秒钟内执行搜索所需的时间。假设A的常数是 0.2,B的常数是 1000,这意味着 A 比 B 强大 5000 倍。对于输入数组大小 n 的小值,快速计算机可能需要更少的时间。但是,在输入数组大小达到某个值后,与线性搜索相比,二分搜索肯定会开始花费更少的时间,即使二分搜索是在慢速机器上运行的。原因是二分搜索相对于输入大小的增长顺序是对数的,而线性搜索的增长顺序是线性的。因此,在输入大小的某个值之后,始终可以忽略与机器相关的常量。


以下是此示例的一些运行时间:

A 上的线性搜索运行时间(以秒为单位) :0.2 * n

B 上的二进制搜索运行时间(以秒为单位) :1000*log(n)

------------------------------------------------
|n      | Running time on A | Running time on B |
-------------------------------------------------
|10     | 2 sec             | ~ 1 h             |
-------------------------------------------------
|100    | 20 sec            | ~ 1.8 h           |
-------------------------------------------------
|10^6   | ~ 55.5 h          | ~ 5.5 h           |
-------------------------------------------------
|10^9   | ~ 6.3 years       | ~ 8.3 h           |
-------------------------------------------------

渐近分析总是有效吗?

渐近分析并不完美,但这是分析算法的最佳方法。例如,假设有两种排序算法在一台机器上分别花费 1000nLogn 和 2nLogn 时间。这两种算法渐近相同(增长顺序为 nLogn)。因此,对于渐近分析,我们无法判断哪个更好,因为我们忽略了渐近分析中的常量。

此外,在渐近分析中,我们总是谈论大于常数值的输入大小。有可能这些大输入永远不会提供给您的软件,而渐近较慢的算法总是在您的特定情况下表现更好。因此,您最终可能会选择一种渐近速度较慢但对您的软件来说速度较快的算法。


目录
相关文章
|
13天前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
41 4
|
3天前
|
算法
PID算法原理分析
【10月更文挑战第12天】PID控制方法从提出至今已有百余年历史,其由于结构简单、易于实现、鲁棒性好、可靠性高等特点,在机电、冶金、机械、化工等行业中应用广泛。
11 0
|
9天前
|
算法
PID算法原理分析及优化
【10月更文挑战第6天】PID控制方法从提出至今已有百余年历史,其由于结构简单、易于实现、鲁棒性好、可靠性高等特点,在机电、冶金、机械、化工等行业中应用广泛。
20 0
|
1月前
|
算法 搜索推荐 开发者
别再让复杂度拖你后腿!Python 算法设计与分析实战,教你如何精准评估与优化!
在 Python 编程中,算法的性能至关重要。本文将带您深入了解算法复杂度的概念,包括时间复杂度和空间复杂度。通过具体的例子,如冒泡排序算法 (`O(n^2)` 时间复杂度,`O(1)` 空间复杂度),我们将展示如何评估算法的性能。同时,我们还会介绍如何优化算法,例如使用 Python 的内置函数 `max` 来提高查找最大值的效率,或利用哈希表将查找时间从 `O(n)` 降至 `O(1)`。此外,还将介绍使用 `timeit` 模块等工具来评估算法性能的方法。通过不断实践,您将能更高效地优化 Python 程序。
44 4
|
1月前
|
算法 程序员 Python
程序员必看!Python复杂度分析全攻略,让你的算法设计既快又省内存!
在编程领域,Python以简洁的语法和强大的库支持成为众多程序员的首选语言。然而,性能优化仍是挑战。本文将带你深入了解Python算法的复杂度分析,从时间与空间复杂度入手,分享四大最佳实践:选择合适算法、优化实现、利用Python特性减少空间消耗及定期评估调整,助你写出高效且节省内存的代码,轻松应对各种编程挑战。
29 1
|
1月前
|
算法 数据可视化
基于SSA奇异谱分析算法的时间序列趋势线提取matlab仿真
奇异谱分析(SSA)是一种基于奇异值分解(SVD)和轨迹矩阵的非线性、非参数时间序列分析方法,适用于提取趋势、周期性和噪声成分。本项目使用MATLAB 2022a版本实现从强干扰序列中提取趋势线,并通过可视化展示了原时间序列与提取的趋势分量。代码实现了滑动窗口下的奇异值分解和分组重构,适用于非线性和非平稳时间序列分析。此方法在气候变化、金融市场和生物医学信号处理等领域有广泛应用。
|
16天前
|
算法 安全 Go
Python与Go语言中的哈希算法实现及对比分析
Python与Go语言中的哈希算法实现及对比分析
21 0
|
2月前
|
算法
算法设计与分析作业
这篇文章是关于算法设计与分析的作业,其中包含了两个算法实现:一个是使用分治算法实现的十进制大整数相乘(包括加法、减法和乘法函数),并进行了正确性和健壮性测试;另一个是使用快速排序思想实现的分治查找第K小元素的程序,并分析了其平均和最坏时间复杂度。
算法设计与分析作业
|
1月前
|
机器学习/深度学习 存储 人工智能
文本情感识别分析系统Python+SVM分类算法+机器学习人工智能+计算机毕业设计
使用Python作为开发语言,基于文本数据集(一个积极的xls文本格式和一个消极的xls文本格式文件),使用Word2vec对文本进行处理。通过支持向量机SVM算法训练情绪分类模型。实现对文本消极情感和文本积极情感的识别。并基于Django框架开发网页平台实现对用户的可视化操作和数据存储。
37 0
文本情感识别分析系统Python+SVM分类算法+机器学习人工智能+计算机毕业设计
|
1月前
|
编解码 算法 图形学
同一路RTSP|RTMP流如何同时回调YUV和RGB数据实现渲染和算法分析
我们播放RTSP|RTMP流,如果需要同时做渲染和算法分析的话,特别是渲染在上层实现(比如Unity),算法是python这种情况,拉两路流,更耗费带宽和性能,拉一路流,同时回调YUV和RGB数据也可以,但是更灵活的是本文提到的按需转算法期望的RGB数据,然后做算法处理