数据结构和算法简介

简介: 1.基本概念—数据:数据是描述客观事物的数值、字符以及能输入机器且能被处理的各种符号集合例如除了表示人的姓名、身高、体重的字符、数字是数据,人的照片、指纹、三维模型、语言指令等也都是数据。数据项、数据元素、数据对象都是数据(1)数据项具有原子性,是不可分割的最小数据单位(2)数据元素:是数据的基本单位,是数据集合的个体,通常由若干数据项组成,在计算机程序中通常作为一个整体来进行处理。(3)数据对象是性质相同的的数据元素的集合,是数据的子集




1.基本概念


—数据:数据是描述客观事物的数值、字符以及能输入机器且能被处理的各种符号集合

例如除了表示人的姓名、身高、体重的字符、数字是数据,人的照片、指纹、三维模型、语言指令等也都是数据。数据项、数据元素、数据对象都是数据


(1)数据项具有原子性,是不可分割的最小数据单位


(2)数据元素:是数据的基本单位,是数据集合的个体,通常由若干数据项组成,在计算机程序中通常作为一个整体来进行处理。


(3)数据对象是性质相同的的数据元素的集合,是数据的子集


a0168fdc62584835b095f5d43d985a2a.png


2.数据结构


2.1基本概念


(1)数据结构是指相互之间存在的一种或多种特定关系的数据元素的集合,是组织并存储数据以便能够有效使用的一种专门格式,它用来反映一个数据的内部构成,即一个数据由哪些成分数据构成,以什么方式构成,是什么结构。


(2)表示一组数据元素及其相互关系的数据结构具有两种不同的表现形式:

①一种是数据结构的逻辑层面,即数据的逻辑结构

②另一种是存在于计算机世界的物理层面,即数据的存储结构

数据结构=逻辑结构+存储结构

数据结构=逻辑结构+存储猎狗+(在存储结构上的)运算/操作


5f28ca6489434e3bb0bad7fa38d30356.png


2.2 逻辑结构


1.逻辑结构分类1:


(1)线性结构:有且只有一个开始节点和一个终端节点,并且所有节点都最多只有一个直接前驱和一个直接后继。线性表就是一个典型的线性结构,它有四个基本特征:

①集合中必存在唯一的一个“第一个元素”;

②集合中必存在唯一的一个“最后的元素”

③除第一元素之外,其他元素均为唯一的“前驱”;

④除最后元素之外,其他数据元素均有唯一的“后继”;


(4)非线性结构的逻辑特征是一个结点元素可能对应多个直接前驱和多个直接后继

常见的非线性结构有:树、图等


2.逻辑结构分类2:


(1)集合结构:就是数学集合中所学的集合。集合有三个特征:

①确定性(集合中的元素必须是确定的)

②唯一性(集合中的元素互不相同)

③无序性(集合中的元素没有先后之分)


(2)线性结构:数据元素之间存在着“一对一”的线性关系的数据结构


(3)树状结构:除了第一个数据元素以外每个元素有且仅有一个直接前驱元素,但是可以有多个直接后继元素


(4)网络结构:每个数据元素可以有多个直接前驱元素,也可以有多个直接后继元素。特点是元素之间是多对多的联系


2.3 存储结构


数据的存储结构主要包括数据元素本身的存储以及数据元素之间关系表示,是数据的逻辑结构在计算机中的表示。常见的存储结构有顺序存储,链式存储,索引存储,以及散列存储。


(1)顺序存储结构:把逻辑上相邻的节点存储在物理位置上相邻的存储单元中,结点之间的逻辑关系由存储单元的邻接关系来体现。由此得到的存储结构为顺序存储结构。(数据元素的存储对应于一块连续的存储空间,数据元素之间的前驱和后继关系通过数据元素在存储器中的相对位置来反映),


①优点

节省存储空间,因为分配给数据的存储单元全用存放结点的数据,结点之间的逻辑关系没有占用额外的存储空间。采用这种方法时,可实现对结点的随机存取,即每一个结点对应一个序号,由该序号可以计算出来结点的存储地址。


②缺点

插入和删除操作需要移动元素,效率较低


a0ce84a4badc490b8ef90456128e8f35.png


(2)链式存储结构:数据元素的存储对应的是不连续的存储空间,每个存储节点对应一个需要存储的数据元素。每个结点是由数据域和指针域组成。元素之间的逻辑关系通过存储节点之间的链接关系反映出来


特点:

①比顺序存储结构的存储密度小( 每个节点都由数据域和指针域组成,所以相同空间内假设全存满的话顺序比链式存储的更多)

②逻辑上相邻的节点物理上不必相邻

③插入、删除灵活(不必移动节点,只需改变节点中的指针)


809a65c3c6cb44ccba8f19489d885672.png


(3)索引存储结构:除建立结点信息外,还建立附加的索引表来标识结点的地址。比如图书、字典的目录


(4)散列存储结构:根据结点的关键字直接计算出该结点的存储地址

一种神奇的结构,添加、查询速度块。


注意:


(1)同一逻辑结构可以对应多种存储结构

(2)同样的运算,在不同的存储结构中,其实现过程是不同的


bcd374d5c5064597bc88d379c6c9ca1f.png


3.算法


1.什么是算法?


算法就是计算机解题的过程


2.算法的5个特性:


(1)输入:一个算法应以待解决的问题的信息作为输入


(2)输出:输入对应指令集处理后得到的信息


(3)可行性:算法是可行的,即算法中的每一条指令都是可以实现的,均能在有限的时间内完成


(4)有穷性:算法执行的指令的个数是有限的,每个指令又是在有限时间内完成的,因此整个算法也是在有限时间内可以结束的


(5)确定性:算法对于特定的合法输入,其对应的输出是唯一的。即当算法从一个特定输入开始,多次执行同一指令集结果总是相同的


3.什么是复杂度?


(1)时间复杂度是指执行算法所需要的计算工作量。

①一个算法中的语句执行次数称为语句频度或时间频度,表示为T(n),n表示问题的规模。

时间复杂度就是时间频度去掉低阶项和首项常数。

②最坏情况下的时间复杂度称为最坏时间复杂度。一般不特别说明,讨论的时间复杂度均是最坏情况下的时间复杂度。

③在最坏情况下的时间复杂度为T(n)=O(n),它表示对于任何输入实例,该算法的运行时间不可能大于O(n)


(2)空间复杂度是指执行这个算法所需要的内存空间


3.1 时间复杂度的计算


(1)找出算法中的基本语句;

算法中执行次数最多的那条语句就是基本语句,通常是最内层循环的循环体


(2)计算基本语句的执行次数的数量级;


①只需计算基本语句执行次数的数量级,这就意味着只要保证基本语句执行次数的函数中的最高次幂正确即可

②可以忽略所有最低次幂和最高次幂的系数。这样能够简化算法分析,并且使注意力集中在最重要的一点上:即增长率


(3)用大O记号表示算法的时间性能

将基本语句执行次数的数量级放入大O记号中


3.2时间复杂度举例


(1)①一个简单语句的时间复杂度为O(1)
int count = 0;
②100个简单语句的时间复杂度也为O(1)
   因为100是常数,不是趋向无穷大的n
(3)一个循环的时间复杂度为O(n)
int n=8;count=0;
for(int i=1;i<=n;i++)
  count++;
(4)时间复杂度为O(log2n)的循环语句
int n=8,count=0
for(int i=1;i<=n;i*=2)
  count++;
(5)时间复杂度为O(n²)的二重循环体
int n=8;count=0;
for(int i=1;i<=n;i++)
  for(int j=1;j<=n;j++)
    count++;  
(6)时间复杂度为O(nlog2n)的二重循环体
int n=8;count =0;
for(int i=1;i<=n;i*=2)
  for(int j=1;j<=n;j++)
   count++;


dba8f2a5877341f28b0ab853bd9eac7c.png


3.3空间复杂度


(1)算法的存储量包括:

①程序本身所占空间

②输入数据所占空间

③辅助变量所占空间


(2)输入数据所占空间只取绝于问题本身,和算法无关,则只需要分析除输入和程序之外的辅助变量所占额外空间


(3)空间复杂度是对一个算法在运行过程中临时占用的存储空间大小的量度,一般也作为问题规模n的函数,以数量级形式给出,记作:S(n)=O(g(n))


(4)例子


①例子①


int fun(int n){
  int i,j,k,s;
  s=0;
  for(i=0;i<=n;i++)
    for(j=0;j<=i;j++)
      for(k=0;k<=j;k++)
      s++;
  return(s);    
}


分析:i,j,k,s各占一个空间,总共4个空间,即S(n)=O(1)

例子②(递归)


void fun(int a[],int n;int k)
// 数组a共有n个元素
{ int i;
if(k == n-1)
for(i=0;i<n;i++)
printf(“%d\n”,a[i]);//执行n次
else
{for(i=k;i<n;i++)
a[i]=a[i]+i*i;//执行n-k次
fun(a,n,k+1); 
}
} 


此属于递归算法,每次调用本身都要分配空间,fun(a,n,0)的空间复杂度为O(n)

目录
相关文章
|
2月前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
47 1
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
113 4
|
3月前
|
存储 人工智能 算法
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
这篇文章详细介绍了Dijkstra和Floyd算法,这两种算法分别用于解决单源和多源最短路径问题,并且提供了Java语言的实现代码。
99 3
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
|
9天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
46 20
|
2月前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
2月前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
2月前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
110 23
|
2月前
|
算法
数据结构之蜜蜂算法
蜜蜂算法是一种受蜜蜂觅食行为启发的优化算法,通过模拟蜜蜂的群体智能来解决优化问题。本文介绍了蜜蜂算法的基本原理、数据结构设计、核心代码实现及算法优缺点。算法通过迭代更新蜜蜂位置,逐步优化适应度,最终找到问题的最优解。代码实现了单链表结构,用于管理蜜蜂节点,并通过适应度计算、节点移动等操作实现算法的核心功能。蜜蜂算法具有全局寻优能力强、参数设置简单等优点,但也存在对初始化参数敏感、计算复杂度高等缺点。
62 20
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
63 1
|
2月前
|
机器学习/深度学习 算法 C++
数据结构之鲸鱼算法
鲸鱼算法(Whale Optimization Algorithm,WOA)是由伊朗研究员Seyedali Mirjalili于2016年提出的一种基于群体智能的全局优化算法,灵感源自鲸鱼捕食时的群体协作行为。该算法通过模拟鲸鱼的围捕猎物和喷出气泡网的行为,结合全局搜索和局部搜索策略,有效解决了复杂问题的优化需求。其应用广泛,涵盖函数优化、机器学习、图像处理等领域。鲸鱼算法以其简单直观的特点,成为初学者友好型的优化工具,但同时也存在参数敏感、可能陷入局部最优等问题。提供的C++代码示例展示了算法的基本实现和运行过程。
56 0