【基础篇】3 # 数组:为什么很多编程语言中数组都从0开始编号?

简介: 【基础篇】3 # 数组:为什么很多编程语言中数组都从0开始编号?

说明

【数据结构与算法之美】专栏学习笔记



什么是数组?

数组(Array)是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据


线性表和非线性表

  • 线性表(Linear List):就是数据排成像一条线一样的结构,每个线性表上的数据最多只有前和后两个方向,比如:数组,链表、队列、栈都是线性表结构。
  • 非线性表:数据之间并不是简单的前后关系,比如二叉树、堆、图等。



数组是如何实现根据下标随机访问数组元素的?


随机访问的意思,就是可以随机选择下标,进行数据访问,根据下标随机访问的时间复杂度为 O(1)。


如下图:计算机给数组 int a[10],分配了一块连续内存空间 1000~1039。

c53fc7367ae1418d8dbc2de6b03b953c.png


当计算机需要随机访问数组中的某个元素时,会首先通过计算机寻址公式计算出该元素存储的内存地址:

a[i]_address = base_address + i * data_type_size


  • data_type_size:表示数组中每个元素的大小,a[10] 是 int 类型,该值为 4 个字节
  • base_address:内存块的首地址,a[10] 这里就是 1000



插入和删除操作为什么低效?

插入操作


假设数组的长度为 n,如果将一个数据插入到数组中的第 k 个位置,那么需要将第 k~n 这部分的元素都顺序地往后挪一位,把第 k 个位置腾出来给新来的数据。


插入操作的时间复杂度分析:


   最坏时间复杂度为:开头插入元素,所有的数据都需要依次往后移动一位,时间复杂度为 O(n)

   最好时间复杂度:末尾插入元素,无需移动,时间复杂度为 O(1)

   平均时间复杂度:插入到每一个位置的概率都是 1/n,插入到数组的第一个位置需要移动 n 个元素;


插入到数组的第二个位置需要移动 n -1 个元素,以此类推,插入到数组中的最后一个位置,需要移动1个元素.,(n + n - 1 + n - 2 + ... + 1)/n = (n+1)/2,时间复杂度为 O(n)


如果数组中存储的数据并没有任何规律,数组只是被当作一个存储数据的集合,直接将第 k 位的数据搬移到数组元素的最后,把新的元素直接放入第 k 个位置,这样时间复杂度就会降为 O(1)。


示意图如下:

3ddcb8593dae41f3a87fafbebbd23d96.png


删除操作

如果要删除第 k 个位置的数据,为了内存的连续性,需要移动数据。


删除操作的时间复杂度分析:


   最坏时间复杂度为:删除开头的数据,所有的数据都需要依次往前移动一位,时间复杂度为 O(n)

   最好时间复杂度:删除数组末尾的数据,无需移动,时间复杂度为 O(1)

   平均时间复杂度:和插入类似,时间复杂度为 O(n)


如果不一定非得追求数组中数据的连续性,可以将多次删除操作集中在一起执行,提高删除的效率。比如:标记清除垃圾回收算法里就有用到。



数组访问越界问题

看个例子:

int main(int argc, char* argv[]){
    int i = 0;
    int arr[3] = {0};
    for(; i <= 3; i++){
        arr[i] = 0;
        printf("hello world\n");
    }
    return 0;
}



如果 i < 3,那么结果输出如下:


a38d668d88be4c68b67830a219f1077a.png


上面这段代码是 i <= 3,当 i = 3 时,数组 a[3] 访问越界,而 a[3] 内存地址指向的是 i 对应内存地址的位置,所以修改 a[3] 的值,也就是修改 i 的值,这时 i 也等于 0,就出现了死循环。


005587235c9240358714963893eaeb27.png


因为 C 语言里并没有规定数组访问越界时编译器应该如何处理,而 Java 会做越界检查,超出就会抛出:java.lang.ArrayIndexOutOfBoundsException。,访问数组的本质就是访问一段连续内存,只要数组通过偏移计算得到的内存地址是可用的,那么程序就可能不会报任何错误。



数组从 0 开始编号的原因

  1. 底层计算机寻址指令可以少计算一个减法
  2. 历史原因:沿用了 C 语言从 0 开始计数的习惯



从数组存储的内存模型上来看,下标最确切的定义应该是偏移(offset)。


a[0] 表示偏移为 0 的位置,也就是首地址,a[k] 表示偏移 k 个 type_size 的位置,计算 a[k] 的内存地址:

a[k]_address = base_address + k * type_size


如果从 1 开始计算,每次随机访问数组元素都多了一次减法运算,对于 CPU 来说,就是多了一次减法指令。

a[k]_address = base_address + (k - 1) * type_size



JavaScript 中的数组

JavaScript 中的数组数据可以是不同类型,它的语法相对宽松。


数组的创建与读写

字面量方式创建数组:

var kaimo = [3, 1, 3];


构造函数方式创建数组:

var kaimo = new Array(3, 1, 3);


判断一个对象是否是数组:

Array.isArray(kaimo);


可以使用循环读写数组:

var kaimo = [3, 1, 3];
for (var i = 0; i < kaimo.length; i++) {
  console.log(kaimo[i]);
}


数组的深复制与浅复制

  • 浅复制:当把数组赋给另外一个数组,然后改变其中一个数组的值,另一数组也会随之改变,这就是数组的浅复制。
  • 深复制:指的就是不改变原来的数组而去创建一个新的数组,这种情况是经常使用的,为了不破坏原数组。



存取函数

JavaScript 提供了一组用来访问数组元素的函数,叫存取函数。最常用的存取函数就是 indexOf() 函数,还有 join 和 toString 函数,concat 和 splice 函数。



可变函数

不去引用数组中的某个元素,就能改变数组内容,这种函数称它为可变函数


push() 方法可以在数组末尾添加元素

unshift() 方法可以在数组开头添加元素

pop() 可以删除数组末尾的元素

shift() 删除数组的第一个元素

splice() 不仅可以用来删除元素,还可以添加元素进数组

sort() 可以为数组排序

reverse() 将数组内的元素翻转


sort() 方法用原地算法对数组的元素进行排序,并返回数组。默认排序顺序是在将元素转换为字符串,然后比较它们的 UTF-16 代码单元值序列时构建的。

var kaimo = [30, 100, 40, 500, 200];
kaimo.sort();


7302b2e73fa843c58f5b9b3fe2dc94fb.png


解决这种排序的错误:在调用 sort() 的时候传入一个函数,该函数可以比较出大小。

function compare(a1, a2) {
    return a1 - a2;
}
var kaimo = [30, 100, 40, 500, 200];
kaimo.sort(compare);

d8408b1d6c2c4c2f9803b9afc99567ba.png



迭代器方法


迭代函数通过对数组中的元素逐个应用,来操作返回相应的值。


不返回新数组forEach() 、every()、some()、reduce()


   every() 返回值为布尔类型,对于应用的所有元素,该函数返回 true,则该方法返回 true

   some() 与 every() 的不同就是只要有一个元素使改函数返回 true ,那么该方法就返回 true

   reduce() 可以对数组元素进行求和、也能将数组元素连接成字符串。


返回新数组: map() 、filter()

map 的作用与 forEach 是一样的,区别就是 map 函数返回的是一个新数组。


filter 和 every 相似,区别在于当所有的元素使改函数为 true 时,它并不返回布尔类型,而是返回一个新数组。



二维数组

JavaScript 可以通过在数组里在嵌套一个数组来形成二维数组。

var kaimo = [
    [11, 12, 13, 14],
    [21, 22, 23, 24],
    [31, 32, 33, 34],
    [41, 42, 43, 44]
];
console.log(kaimo[1][2]); // 23


二维数组的处理可以分为两种:

  • 按列访问,外层循环对应行,内层循环对应列。
  • 按行访问,外层循环对应列,内层循环对应行。

JavaScript 可以处理一些参差不齐的数组,JavaScript 可以处理运行而不报错。



对象数组

数组里面的元素可以是对象,可以用 push() 等操作方法来操作对象数组。

目录
相关文章
|
8月前
|
存储 算法 搜索推荐
在C++编程语言中数组的作用类型
在C++编程语言中数组的作用类型
75 0
在C++编程语言中数组的作用类型
|
8月前
|
存储 数据可视化 C语言
C 语言数组教程:定义、访问、修改、循环遍历及多维数组解析
数组用于将多个值存储在单个变量中,而不是为每个值声明单独的变量。 要创建数组,请定义数据类型(例如 int)并指定数组名称,后面跟着方括号 []。 要将值插入其中,请使用逗号分隔的列表,并在花括号内使用
1143 0
|
C语言
C语言之输出一个二维数组中,求每列最大的元素,并存放在另一个数组中
C语言之输出一个二维数组中,求每列最大的元素,并存放在另一个数组中
169 0
|
7月前
|
C语言
C语言学习记录——矩阵转换(定义一个数组实现或定义两个数组实现)
C语言学习记录——矩阵转换(定义一个数组实现或定义两个数组实现)
71 0
|
8月前
|
编译器 程序员 C语言
【C语言】变长数组,二分查找和数组之间自动替换的实现
【C语言】变长数组,二分查找和数组之间自动替换的实现
|
8月前
|
存储 程序员 C++
在C++语言中数组和指针的关系
在C++语言中数组和指针的关系
67 0
|
搜索推荐 编译器 C++
C++基础:第5~6章:数组\函数
C++基础:第5~6章:数组\函数
60 0
|
人工智能 算法 BI
C语言的数组为什么要从0开始编号
C语言的数组为什么要从0开始编号
89 0
|
存储 数据挖掘 Linux
Python学习笔记丨数据类型基础与易错点总结,列表、字典、集合、数值、字符串、元组
Python学习笔记丨数据类型基础与易错点总结,列表、字典、集合、数值、字符串、元组
|
C语言
C语言 冒泡排序(任意类型数据)
C语言 冒泡排序(任意类型数据)
62 0