Python数据结构与算法——顺序表

简介: 概念在程序中,经常需要将一组(通常为同一个类型的)数据元素作为整体管理和使用,需要创建这种元素组,用变量记录它们,传进传出函数等(例如,Python中的列表)。

概念

在程序中,经常需要将一组(通常为同一个类型的)数据元素作为整体管理和使用,需要创建这种元素组,用变量记录它们,传进传出函数等(例如,Python中的列表)。一组数据中包含的元素个数可能发生变化(可以增加或者删除元素)。

对于元素增删改查的需求,最简单的解决办法就是将这一组元素当做一个序列,用元素序列里的位置和顺序,表示实际应用中的某种有意义的信息,或者表示数据之间的某种关系。

这样的一组序列元素的组织形式,即可抽象为线性表,一个线性表是某类元素的一个集合,还记录着元素之间的一种顺序关系。线性表是最基本的数据结构之一。

根据线性表的实际存储方式,分为两种实现模型:

  • 顺序表:将元素顺序地存放在一块连续的存储区里,元素间的顺序关系由它们的存储顺序自然表示

  • 链表: 将元素存放再通过链接构造起来的一系列存储块中

顺序表的基本形式

数据元素本身连续存储,每个元素所占的存储单元大小相同,元素的下标是其逻辑地址,而元素存储的物理地址(实际内存地址)可以通过存储区的起始地址加上逻辑地址与存储单元大小的乘积计算而得

  • 即: L0c(i) = L0 + i * c

  • 作图解释为下:

img_34e337f6fcb11962aa3983b98a98fda2.png
1_note_shunxubiao.png
  • 32位操作系统中,一个整型占用4个字节(Byte),因此列表my_list中四个整型占用字节数为16个字节,且每个元素所占用字节数相同

所以访问指定元素时无需从头遍历,通过计算便可获得对应地址,其时间复杂度为O(1).

顺序表的基本形式的特殊形式

如果元素的大小不统一,则须采用元素外置的形式,将实际数据元素另行存储,而顺序表中各单元位置保存对应元素的地址信息(即链接)。由于每个链接所需的存储量相同,通过上述公式,可以计算出元素链接的存储位置,而后顺着链接找到实际存储的数据元素。此时公式中的 c 则不再是数据元素大小,而是存储一个链接地址所需的存储量。

顺序表的结构

  • 不考虑用Python语言具体实现,真正实现数据表结构的时候,怎么构造数据
img_59b7a9e071e9446f40f615ee54833fdf.png
2_note_顺序表的结构.png
  • 出了存储数据的数据区之外,往往还会加上表头信息

  • 表头信息即:上图中上面的部分

  • 下面部分为数据区 (连续的存储空间,内存的概念见后面的图解)

  • 构造一个数据表的时候,首先要预估数据需要多少的空间,指明数据存储所需空间,即数据区。如上图中所示,即为8个数据。那么就要向计算机申请8个空间,在表头指明

一个顺序表的完整信息包括两部分,一部分是表中的元素集合,另一部分是为实现正确操作而需记录的信息,即有关表的整体情况的信息,这部分信息主要包括元素存储去的容量和当前表中已有的元素个数两项。

顺序表的两种基本实现方式

  • 一体式结构:
img_c1923d4426efed99191920fc3b23af6c.png
3_note_顺序表的两种实现方式一.png

一体式结构,存储表信息的单元与元素存储区以连续的方式安排在一块存储区里,两部分数据的整体形成一个完整的顺序表对象,这种结构整体性强,易于管理。

由于数据元素存储区域是表对象的一部分,顺序表创建后,元素存储区就固定了

  • 分离式结构:
img_be51507eecce50e0236026d256d13165.png
4_note_顺序表的两种实现方式二.png

分离式结构,表对象里只保存与整个表有关的信息(容量个元素个数),实际数据元素存放在另一个独立的元素存储区里,通过链接与基本表对象关联。

元素存储区替换

一体式结构由于顺序表信息区与数据区连续存储在一起,所以想要更换数据区,就只能整体搬迁,即整个顺序表对象(存储顺序表的结构信息的区域)改变了。

分离式结构想要更换数据区,只需要将表信息区中的数据区链接地址更新即可,而该顺序表对象不变。

元素存储区扩充

采用分离式结构的顺序表,若将数据区更换为存储空间更大的区域,则可以在不改变表对象的前提下对其数据存储区进行了扩充,所有使用这个表的地方都不必修改。只要程序的运行环境还有空闲存储,这种表结构就不会因为满了而导致操作无法进行。此种顺序表被称为动态顺序表,因为其容量可以在使用中动态变化。

  • 扩充的两种策略

  • 每次扩充增加固定数目的存储位置,如每次扩充增加8个元素位置,这种策略称为线性增长

  • 每次扩充容量加倍,如每次扩充增加一倍存储空间。

特点: 减少了扩充操作的执行次数,但可能会浪费空间资源。以空间换时间,推荐的方式。


补充:

内存:

img_c564908f949b883765606b60f34db786.png
5_内存.png

思维导图

img_13f792812d37c3830942478570aec18b.png
6_顺序表思维导图.png

顺序表的操作

增加元素

img_562dc50b71b190a97204104db633680d.png
7_顺序表的操作.png
  1. 尾端加入元素,如图所示,直接在顺序表的元素末尾加上元素,其时间复杂度为O(1)

  2. 保序的加入元素,如图所示,将增加的元素50,放在索引为1的位置,则对应的其他元素则分别向后移动,此为保序,没有破坏增加元素之前的元素顺序,但因会让增加元素所在位置之后的元素都产生移动,其时间复杂度为O(n)

  3. 非保序的加入元素,其时间复杂度为O(1),由于其会破坏顺序表原有的元素顺序,因此不常用

删除元素

img_ae2e67b7496ba89ca2f074705c70f228.png
8_顺序表的操作_删除元素.png

)

  1. 删除表尾的元素,其时间复杂度为O(1)

  2. 保序的元素删除,时间复杂度为O(n)

  3. 非保序的元素删除,时间复杂度为O(1)

Python 中的顺序表

Python 中的list和tuple两种类型采用了顺序表的实现技术

  • tuple 是不可变类型,即不变的顺序表,因此不支持改变其内部状态的任何操作,而其他方面,则与list的性质类似

list 的基本实现技术

Python 标准类型list 就是一种元素个数可变的线性表,可以加入和删除元素,并在各种操作中维持已有元素的顺序(即保序),而且还具有以下行为特征:

  • 基于下标(位置) 的高效元素访问和更新,时间复杂度是O(1); 为满足该特征,应该采用顺序表技术,表中元素保存在一块连续的存储区中。

  • 允许任意加入元素,而且在不断加入元素的过程中,表对象的标识不变;为满足该特征,必须能更换元素存储区,并且为保证更换存储区时list对象的标识不变,只能采用分离式实现技术。

在Python的官方实现中,list就是一种采用分离式技术实现的动态顺序表。因此,使用list.append()加入元素比在指定位置插入元素效率高。


重点总结:

在Python的官方实现中,list实现采用了下面的策略,在建立空表时,系统分配一块能容纳8个元素的存储区;在执行插入操作(insert和append)时,如果元素存储区满就换一块4倍大的存储区。但如果此时的表已经很大(目前的阈值为50000),则改变策略,采用加一倍的方法。引入这种改变策略的方式是为了避免出现过多空闲的存储位置。


作者:techLee
个人博客地址:www.limiao.tech

原创文章,转载请告知

目录
相关文章
|
22天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
229 55
|
11天前
|
存储 缓存 监控
局域网屏幕监控系统中的Python数据结构与算法实现
局域网屏幕监控系统用于实时捕获和监控局域网内多台设备的屏幕内容。本文介绍了一种基于Python双端队列(Deque)实现的滑动窗口数据缓存机制,以处理连续的屏幕帧数据流。通过固定长度的窗口,高效增删数据,确保低延迟显示和存储。该算法适用于数据压缩、异常检测等场景,保证系统在高负载下稳定运行。 本文转载自:https://www.vipshare.com
103 66
|
1天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
14 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
1月前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
167 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
21小时前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
15天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
50 20
|
8天前
|
算法 网络协议 Python
探秘Win11共享文件夹之Python网络通信算法实现
本文探讨了Win11共享文件夹背后的网络通信算法,重点介绍基于TCP的文件传输机制,并提供Python代码示例。Win11共享文件夹利用SMB协议实现局域网内的文件共享,通过TCP协议确保文件传输的完整性和可靠性。服务器端监听客户端连接请求,接收文件请求并分块发送文件内容;客户端则连接服务器、接收数据并保存为本地文件。文中通过Python代码详细展示了这一过程,帮助读者理解并优化文件共享系统。
|
13天前
|
存储 算法 Python
文件管理系统中基于 Python 语言的二叉树查找算法探秘
在数字化时代,文件管理系统至关重要。本文探讨了二叉树查找算法在文件管理中的应用,并通过Python代码展示了其实现过程。二叉树是一种非线性数据结构,每个节点最多有两个子节点。通过文件名的字典序构建和查找二叉树,能高效地管理和检索文件。相较于顺序查找,二叉树查找每次比较可排除一半子树,极大提升了查找效率,尤其适用于海量文件管理。Python代码示例包括定义节点类、插入和查找函数,展示了如何快速定位目标文件。二叉树查找算法为文件管理系统的优化提供了有效途径。
45 5
|
12天前
|
数据库
数据结构中二叉树,哈希表,顺序表,链表的比较补充
二叉搜索树,哈希表,顺序表,链表的特点的比较
数据结构中二叉树,哈希表,顺序表,链表的比较补充
|
13天前
|
存储 缓存 算法
探索企业文件管理软件:Python中的哈希表算法应用
企业文件管理软件依赖哈希表实现高效的数据管理和安全保障。哈希表通过键值映射,提供平均O(1)时间复杂度的快速访问,适用于海量文件处理。在Python中,字典类型基于哈希表实现,可用于管理文件元数据、缓存机制、版本控制及快速搜索等功能,极大提升工作效率和数据安全性。
49 0

热门文章

最新文章