【柔性数组与局部性原理】

简介: 柔性数组概念对于柔性数组,也许你之前从未听说过,柔性数组,顾名思义,就是数组,它的柔性柔在元素个数可以动态变化,即柔性数组是未知大小的,数组大小可以动态变化的。在结构体中,最后一个元素允许是未知大小的数组,这个数组就叫柔性数组成员。下面直接举例子来说明柔性数组。

柔性数组概念

对于柔性数组,也许你之前从未听说过,柔性数组,顾名思义,就是数组,它的柔性柔在元素个数可以动态变化,

即柔性数组是未知大小的,数组大小可以动态变化的。

在结构体中,最后一个元素允许是未知大小的数组,这个数组就叫柔性数组成员。

下面直接举例子来说明柔性数组。

struct S
{
  int n;
  int arr[]; 
};

这就是一个柔性数组,柔性数组是在结构体中是未知大小的。

struct S
{
  int n;
  int arr[0]; 
};

上面这种写法也可以。


c9fb27f7582940ceaf8799ac44f6bc5a.png

当我们进行编译时,编译通过。

柔性数组特点:

下面举例说明柔性数组的特点:

假设需要动态开辟一块内存空间,我们可以这样操作:

typedef struct S
{
  int n;
  int arr[];
};

当我们计算这个柔性数组的大小时,结果如下:

9ef3dd4663434963bdac2578a8a595d4.png

看到结果是4,可能你会疑惑,别着急,这就是柔性数组的第一个特点:

特点1:sizeof计算结构体大小时,不包括柔性数组的大小

所以计算上面的结构体的大小时,仅计算n大小,在进行结构体内存对齐后,结果是4 。

特点2:柔性数组成员之前必须至少有一个其他成员。

特点3:包含柔性数组成员的结构用malloc ()函数进行内存的动态分配,并且分配的内存应该大于结构的大小,以适应柔性数组的预期大小。

什么意思呢?举个例子:

typedef struct S
{
  int n;
  int arr[0]; 
}S;
int main()
{
  struct S s = { 0 };
  struct S* ps = (S*)malloc(sizeof(S) + 5 * sizeof(int));
  return 0;
}

看上面的代码:当我们动态申请一块内存时,申请的空间需要大于结构体本身的大小。

在后面增加适当的空间以适应柔性数组的大小。

下面举实际例子来说明柔性数组的一些好处:

typedef struct S
{
  int n;
  int arr[0]; 
}S;
int main()
{
  struct S s = { 0 };
  struct S* ps = (S*)malloc(sizeof(S) + 5 * sizeof(int));
  if (ps == NULL)
  {
    printf("%s\n", strerror(errno));
    return;
  }
  ps->n = 100;
  int i = 0;
  for (i = 0; i < 5; i++)
  {
    ps->arr[i] = i;
  }
}

在内存中申请一块空间,这块空间在内存中是连续的。

517eeff9b27b4fa49dd2a83a4b4d2f01.png然后将n 和arr分别赋值

48ad8761e304423fbdcca5d00d97fbbc.png

如果想使用的空间不够,那就重新申请空间

struct S*ptr=realloc(ps, 44);

44 = 24(原结构体大小) + 20(5*int)

也就是再开辟五个int类型的空间

int main()
{
  struct S s = { 0 };
  struct S* ps = (struct S*)malloc(sizeof(struct S) + 5 * sizeof(int));
  if (ps == NULL)
  {
    printf("%s\n", strerror(errno));
    return;
  }
  ps->n = 100;
  int i = 0;
  for (i = 0; i < 5; i++)
  {
    ps->arr[i] = i;
  }
  struct S*ptr=realloc(ps, 44);
  if (ptr != NULL)
  {
    ps = ptr;
  }
  for (i = 5; i < 10; i++)
  {
    ps->arr[i] = i;
  }
  for (i = 0; i < 10; i++)
  {
    printf("%d ", ps->arr[i]);
  }
  //释放
  free(ps);
  ps = NULL;
  return 0;
}

然后进行赋值,再打印出来,整个完整代码如上:

结果如下:

250181979b594592a997cebae0362b0a.png

使用柔性数组动态开辟内存,这块空间是连续的。

下面来看另一种开辟内存的方法:

struct S
{
  int n;
  int* arr;
};
int main()
{
  struct S* ps = (struct S*)malloc(sizeof(struct S));
  ps->arr = malloc(sizeof(int) * 5);
  int i = 0;
  for (i = 0; i < 5; i++)
  {
    ps->arr[i] = i;
  }
  //加大内存,调整大小
  int *ptr=  realloc(ps->arr, 10 * sizeof(int));
  if (ptr != NULL)
  {
    ps->arr = ptr;
  }
  for (i = 5; i < 10; i++)
  {
    ps->arr[i] = i;
  }
  for (i = 0; i < 10; i++)
  {
    printf("%d ", ps->arr[i]);
  }
  free(ps->arr);//free要有先后顺序
  free(ps);
  ps = NULL;
  return 0;
}

看不懂代码?请看下图:



78145ed35dc340ae808a9a933a6fbb3e.png

首先申请了第一块空间结构体指针ps,该指针指向了上面的S结构体,第二次申请的空间是 ps所指向的结构体成员指针arr,为这个arr成员申请了一块空间,然后增加空间。


在两次申请的过程中,两块空间ps 和 arr所指向的空间 都是在堆区上,结构体是在栈区上,所以释放的时候,只释放申请出来的两块空间,不需要释放结构体空间。


对比两段代码,可以看出不同点:


在第一段代码中,申请的空间是连续的,第二段代码中,申请的空间是不连续的。


第一段代码申请的空间只需free一次,第二段代码申请的空间需要free两次,并且free的先后顺序有要求,需要先释放arr指向的空间,再释放ps。如果释放顺序相反,会导致arr指向的空间就失踪了, 也就是没人能知道arr指向的空间在哪。


所以,在这里使用柔性数组的好处有:

1.方便释放空间。

2.利于内存访问

第二点如何理解?

下面引出局部性原理的概念:

局部性原理

局部性原理是指CPU访问存储器时,无论是存取指令还是存取数据,所访问的存储单元都趋于聚集在一个较小的连续区域中。

意思是:当我们访问一块空间时,接下来有 80%的可能性会访问它周边的数据。

来看下面:


78239079706a4d3ba9c7f93541493b00.png

一个存储器层次结构图如上:

直接画出主要的布局:


d3b2822bd7f94fea8e88f1881f50c37e.png

cpu在访问空间时,首先会在寄存器中读取数据,如果寄存器中没有那块需要读取的空间,就会去高速缓存中寻找,如果高速缓存中也没有这块内存区域,它就会去硬盘中寻找。

这样层层往下寻找。

如上图:

假如需要读取的空间是连续的,那么这块空间放在寄存器中时,cpu先读取一小部分空间,根据局部性原理:cpu有80%的几率读取周围的空间,这样就能够提高访问效率。

这就是使用柔性数组的好处

假如读取的空间是不连续的,而是碎片式的访问。这样读取效率就会降低。

所以,柔性数组的好处在于:

1.方便释放空间。

2.利于内存访问

相关文章
|
10月前
【基本数据结构 三】线性数据结构:栈
【基本数据结构 三】线性数据结构:栈
71 0
|
10月前
|
存储 算法 大数据
内存原理 | 内存分配 | 内存对齐
内存原理 | 内存分配 | 内存对齐
|
9月前
|
存储 缓存 算法
数据结构和算法学习记录——总结顺序表和链表(双向带头循环链表)的优缺点、CPU高速缓存命中率
数据结构和算法学习记录——总结顺序表和链表(双向带头循环链表)的优缺点、CPU高速缓存命中率
89 0
|
6月前
|
机器学习/深度学习 算法 Java
[算法与数据结构] 谈谈线性查找法~
该文章详细介绍了线性查找法的基本概念与实现方法,通过Java代码示例解释了如何在一个数组中查找特定元素,并分析了该算法的时间复杂度。
|
6月前
|
存储 Java C++
链表理论部分
链表理论部分
|
10月前
|
存储 算法 C语言
二叉树顺序结构与堆的概念及性质(c语言实现堆)
二叉树顺序结构与堆的概念及性质(c语言实现堆)
61 0
|
存储 缓存 程序员
C++ 中的内存对齐——理论篇
> 本文作为上篇主要介绍内存对齐的理论基础,后续的下篇将侧重于 C++ 语言层面的实践,敬请期待! ### TL;DR - 处理器以若干字节的块而不是单字节的粒度访问内存,因此对于未对齐的内存需要额外的访存及计算开销,导致性能更差。 - 原子操作和矢量运算指令要求内存地址必须是对齐的,否则可能导致程序死循环和数据错误。 - 编译器通过 padding 自动对结构中的字段进行对齐,用以向后兼容以
815 0
C++ 中的内存对齐——理论篇
|
存储 算法
【霍罗维兹数据结构】单链表 | 动态链接的栈和队列 | 多项式 - POLYNOMIALS | 一些链表的操作
【霍罗维兹数据结构】单链表 | 动态链接的栈和队列 | 多项式 - POLYNOMIALS | 一些链表的操作
96 0
|
存储 算法 Serverless
常见数据结构-散列表(上)理论
常见数据结构-散列表(上)理论
202 0
|
机器学习/深度学习 算法 C语言
时间复杂度和空间复杂度计算(数据结构C语言实现1)
时间复杂度和空间复杂度计算(数据结构C语言实现1)
432 2
时间复杂度和空间复杂度计算(数据结构C语言实现1)