多数pythoneer只知有列表list却不知道python也有array数组

简介: 多数pythoneer只知有列表list却不知道python也有array数组

116b1554b77e41e4a0f962f6f656f027.png

数组和列表

Python中数组和列表是不同的,我敢断言大多数的pythoneer只知道有列表list,却不知道python也有array数组。列表是一个包含不同数据类型的元素集合,而数组是一个只能含相同数据类型的元素集合。

Python的array库是一个提供数组操作的模块,它提供了一种用于存储和处理多个相同类型元素的容器。与Python的列表list相比,数组array在存储和操作大量数值型数据时更为高效,因为它在内存中以连续的方式存储数据,占用的内存空间更小。

数组创建

array(typecode [, initializer]) -> array

返回一个新数组,该数组的项受类型代码的限制,并通过可选的初始值设定项值进行初始化,该值必须是列表、字符串或可在适当类型的元素上迭代。

数组表示基本值,其行为与列表非常相似,只是其中存储的对象类型受到约束。类型是在对象创建时使用类型代码指定的,该代码是单个字符。

类型代码 typecode

类型 C类型 最小字节
'b' signed integer  1
'B' unsigned integer    1
'u' Unicode character   2
'h' signed integer  2
'H' unsigned integer    2
'i' signed integer  2
'I' unsigned integer    2
'l' signed integer  4
'L' unsigned integer    4
'q' signed integer  8
'Q' unsigned integer    8
'f' floating point  4
'd' floating point  8

创建数组

import array  

arr = array.array('i', [1, 2, 3, 4, 5])  # 创建一个整数类型的数组

arr = array.array('u', 'abcde')  # 创建一个字符类型的数组

类型属性

import array  

arr = array.array('i', [1, 2, 3, 4, 5])

print(arr.typecode)   # 打印数组类型 i

数组切片

与列表用法相同:

>>> arr = array.array('i', [1, 2, 3, 4, 5])
>>> arr[0]
1
>>> arr[2]
3
>>> arr[-1]
5
>>> arr[:3]
array('i', [1, 2, 3])
>>> arr[3:]
array('i', [4, 5])
>>> arr[:-1]
array('i', [1, 2, 3, 4])
>>> arr[::-1]
array('i', [5, 4, 3, 2, 1])
>>> arr[1::2]
array('i', [2, 4])
>>> arr[0::2]
array('i', [1, 3, 5])

类型转换

整数数组可以转换到浮点数数组,反之不行。

>>> arr1 = array.array('i', [1, 2, 3, 4, 5])
>>> arr1
array('i', [1, 2, 3, 4, 5])
>>> arr2 = array.array('f', arr1)
>>> arr2
array('f', [1.0, 2.0, 3.0, 4.0, 5.0])
>>> arr3 = array.array('i', arr2)
Traceback (most recent call last):
  File "<pyshell#77>", line 1, in <module>
    arr3 = array.array('i', arr2)
TypeError: 'float' object cannot be interpreted as an integer

数组与列表占用内存的比较

import sys, array
arr = array.array('i', [_ for _ in range(1024)])
lst = [_ for _ in range(1024)]

print(sys.getsizeof(arr))  # 输出:4176 array对象本身的大小
print(sys.getsizeof(lst))  # 输出:8856 列表list对象本身的大小  
# 注意:这些值可能因操作系统或Python解释器的实现和版本而略有不同。

数组方法

append()--将一个新项追加到数组的末尾

buffer_info()--返回给出当前内存信息的信息

byteswap()--字节交换数组的所有项

count()--返回对象的出现次数

extend()--通过从可迭代项中附加多个元素来扩展数组

fromfile()--从文件对象读取项

fromlist()--从列表中追加项

frombytes()--从字符串中追加项

fromunicode()--从unicode字符串中追加项

index()--返回对象第一次出现的索引

insert()--在数组中提供的位置插入一个新项

pop()--移除并返回项(默认为最后一个)

remove()--删除对象的第一个出现项

reverse()--反转数组中项目的顺序

tofile()--将所有项写入文件对象

tolist()--返回转换为普通列表的数组

tobytes()--返回转换为字符串的数组

在举例讲解前先来复习一个列表list的方法,用法相同的(绿色标注)可以省略不学:

append(self, object, /)
    Append object to the end of the list.

clear(self, /)
    Remove all items from list.

copy(self, /)
    Return a shallow copy of the list.

count(self, value, /)
    Return number of occurrences of value.

extend(self, iterable, /)
    Extend list by appending elements from the iterable.

index(self, value, start=0, stop=9223372036854775807, /)
    Return first index of value.
    Raises ValueError if the value is not present.

insert(self, index, object, /)
    Insert object before index.

pop(self, index=-1, /)
    Remove and return item at index (default last).
    Raises IndexError if list is empty or index is out of range.

remove(self, value, /)
    Remove first occurrence of value.
    Raises ValueError if the value is not present.

reverse(self, /)
    Reverse *IN PLACE*.

sort(self, /, *, key=None, reverse=False)
    Sort the list in ascending order and return None.

用法讲解

buffer_info()

返回当前数组缓冲区的内存信息。

import array
arr = array.array('i', [1, 2, 3])
buffer_info = arr.buffer_info()
print(buffer_info)  # 输出包含内存地址、大小等信息的元组
byteswap()

字节交换数组的所有项,通常用于处理二进制数据的不同字节顺序。

import array
arr = array.array('i', [0x12345678])  # 假设这是一个32位整数  
arr.byteswap()
print(arr)  # 输出:[305419896] (0x78563412)
fromfile()

从文件对象中读取项,通常用于从二进制文件中读取数据。

import array
with open('data.bin', 'rb') as f:
    arr = array.array('i')
    arr.fromfile(f, 3)  # 从文件中读取3个整数  
print(arr)  # 输出:假设文件中有3个整数,则输出这些整数构成的数组
fromlist()

从列表中追加项,创建一个新的数组。

import array
list_data = [1, 2, 3, 4, 5]
arr = array.array('i', list_data)
print(arr)  # 输出:array('i', [1, 2, 3, 4, 5])
frombytes()

从字节字符串中追加项,创建一个新的数组。

import array
byte_data = b'\x01\x02\x03\x04'
arr = array.array('B', byte_data)  # 'B' 表示无符号字符  
print(arr)  # 输出:array('B', [1, 2, 3, 4])
tofile()

将所有项写入文件对象,通常用于将数组数据写入二进制文件。

import array
arr = array.array('i', [1, 2, 3])
with open('output.bin', 'wb') as f:
    arr.tofile(f)
# 现在'output.bin'文件包含数组的数据
tolist()

返回转换为普通列表的数组。

import array
arr = array.array('i', [1, 2, 3])
list_data = arr.tolist()
print(list_data)  # 输出:[1, 2, 3]
tobytes()

返回转换为字节字符串的数组。

import array
arr = array.array('i', [1, 2, 3])
byte_data = arr.tobytes()
print(byte_data)  # 输出:b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'

用法举例

实例1
import array  
  
# 创建一个浮点数类型的array实例  
float_array = array.array('f', [1.0, 2.0, 3.0, 4.0, 5.0])  
  
# 打印原始数组  
print("Original Array:", float_array)  
  
# 计算每个元素的平方  
squared_array = array.array('f')  
for num in float_array:  
    squared_array.append(num ** 2)  
  
# 打印平方数组  
print("Squared Array:", squared_array)  
  
# 计算每个元素的立方  
cubed_array = array.array('f')  
for num in float_array:  
    cubed_array.append(num ** 3)  
  
# 打印立方数组  
print("Cubed Array:", cubed_array)  
  
# 计算平方和立方数组的和  
sum_squared = sum(squared_array)  
sum_cubed = sum(cubed_array)  
  
# 打印和  
print("Sum of Squared:", sum_squared)  
print("Sum of Cubed:", sum_cubed)

输出结果:


Original Array: array('f', [1.0, 2.0, 3.0, 4.0, 5.0])

Squared Array: array('f', [1.0, 4.0, 9.0, 16.0, 25.0])

Cubed Array: array('f', [1.0, 8.0, 27.0, 64.0, 125.0])

Sum of Squared: 55.0

Sum of Cubed: 225.0

实例2
import array  
  
# 原始字符串  
original_string = "Hello, World!"  
  
# 将字符串转换为字符数组  
# 注意:'u' 类型用于存储 Unicode 字符,但在 Python 3 中,'u' 类型已被废弃  
# 我们应该使用 'U' 类型来存储 Unicode 字符(码点),但这通常用于宽字符集  
# 在此示例中,我们将使用字节数组 'b' 并通过编码字符串来处理它  
  
# 编码原始字符串为字节  
encoded_string = original_string.encode('utf-8')  
  
# 创建一个字节类型的array实例  
byte_array = array.array('b', encoded_string)  
  
# 打印字节数组  
print("Byte Array:", byte_array)  
  
# 查找特定字节(例如查找 'o' 字符的字节表示)  
# 注意:这里我们查找的是 'o' 字符的 UTF-8 编码的第一个字节  
# 在 ASCII 中,'o' 的编码是 0x6F,但在 UTF-8 编码的字符串中,我们需要找到正确的字节序列  
# 对于简单的 ASCII 字符,UTF-8 编码与 ASCII 编码相同  
target_byte = ord('o')  # 获取 'o' 字符的 ASCII 码点值  
target_indices = [i for i, b in enumerate(byte_array) if b == target_byte]  
print("Indices of 'o':", target_indices)  
  
# 替换所有 'o' 字符的字节表示为另一个字符(例如 'x')  
# 注意:直接替换可能破坏 UTF-8 编码的多字节字符序列  
# 因此,这个例子仅适用于单字节字符(ASCII 范围内)的字符串  
replacement_byte = ord('x')  # 获取 'x' 字符的 ASCII 码点值  
for i in target_indices:  
    byte_array[i] = replacement_byte  
  
# 将修改后的字节数组转换回字符串  
# 注意:如果替换了多字节字符的一部分,解码可能会失败  
try:  
    modified_string = byte_array.tobytes().decode('utf-8')  
    print("Modified String:", modified_string)  
except UnicodeDecodeError:  
    print("Decoding failed due to invalid UTF-8 sequence.")  
  
# 注意:在处理包含非ASCII字符的字符串时,应该格外小心,  
# 因为UTF-8编码可能会使用多个字节来表示一个字符。  
# 在这种情况下,直接替换单个字节可能会破坏字符的编码。

输出结果:


Byte Array: array('b', [72, 101, 108, 108, 111, 44, 32, 87, 111, 114, 108, 100, 33])

Indices of 'o': [4, 8]

Modified String: Hellx, Wxrld!

实例3
import array  
  
# 创建一个整数类型的array实例  
int_array = array.array('i', [1, 2, 3, 4, 5, 6, 7, 8, 9, 10])  
  
# 打印原始数组  
print("Original Integer Array:", int_array)  
  
# 将数组写入文件  
with open('int_array.bin', 'wb') as f:  
    int_array.tofile(f)  
  
# 打开文件以读取二进制数据  
with open('int_array.bin', 'rb') as f:  
    # 读取整个文件到数组中  
    # 由于我们知道文件中的数据类型和大小,我们可以使用这些信息来创建数组  
    # 假设文件中的整数是32位的(即 'i' 表示整数),并且我们不知道有多少个整数  
    # 我们可以先读取文件的大小,然后除以整数的字节大小来得到整数的数量  
    file_size = f.seek(0, 2)  # 移动到文件末尾以获取文件大小  
    num_ints = file_size // 4  # 假设整数是32位的(4字节)  
    f.seek(0)  # 将文件指针重置回文件开头  
  
    # 创建一个空的array实例,用于存储读取的数据  
    read_array = array.array('i')  
  
    # 从文件中读取整数数据到数组中  
    read_array.fromfile(f, num_ints)  
  
# 打印从文件中读取的数组  
print("Array Read from File:", read_array)
  
# 验证两个数组是否相同  
assert int_array == read_array  
print("The arrays are the same.")

输出结果:


Original Integer Array: array('i', [1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

Array Read from File: array('i', [1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

The arrays are the same.


完。

目录
相关文章
|
2月前
|
存储 Java 数据处理
(numpy)Python做数据处理必备框架!(一):认识numpy;从概念层面开始学习ndarray数组:形状、数组转置、数值范围、矩阵...
Numpy是什么? numpy是Python中科学计算的基础包。 它是一个Python库,提供多维数组对象、各种派生对象(例如掩码数组和矩阵)以及用于对数组进行快速操作的各种方法,包括数学、逻辑、形状操作、排序、选择、I/0 、离散傅里叶变换、基本线性代数、基本统计运算、随机模拟等等。 Numpy能做什么? numpy的部分功能如下: ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组 用于对整组数据进行快速运算的标准数学函数(无需编写循环)。 用于读写磁盘数据的工具以及用于操作内存映射文件的工具。 线性代数、随机数生成以及傅里叶变换功能。 用于集成由C、C++
309 1
|
2月前
|
存储 Java 索引
(Python基础)新时代语言!一起学习Python吧!(二):字符编码由来;Python字符串、字符串格式化;list集合和tuple元组区别
字符编码 我们要清楚,计算机最开始的表达都是由二进制而来 我们要想通过二进制来表示我们熟知的字符看看以下的变化 例如: 1 的二进制编码为 0000 0001 我们通过A这个字符,让其在计算机内部存储(现如今,A 字符在地址通常表示为65) 现在拿A举例: 在计算机内部 A字符,它本身表示为 65这个数,在计算机底层会转为二进制码 也意味着A字符在底层表示为 1000001 通过这样的字符表示进行转换,逐步发展为拥有127个字符的编码存储到计算机中,这个编码表也被称为ASCII编码。 但随时代变迁,ASCII编码逐渐暴露短板,全球有上百种语言,光是ASCII编码并不能够满足需求
158 4
|
8月前
|
索引 Python
Python错误 - 'list' object is not callable 的问题定位与解决
出现编程问题并不可怕,关键在于是否可以从中学习与成长。遇到'list' object is not callable这样的错误,我们不仅需要学会应对,更需要了解其背后的原因,避免类似的问题再次出现。记住,Python的强大功能和灵活性同时也意味着我们需要对其理解更准确,才能更好的使用它。
942 70
|
9月前
|
人工智能 Java
Java 中数组Array和列表List的转换
本文介绍了数组与列表之间的相互转换方法,主要包括三部分:1)使用`Collections.addAll()`方法将数组转为列表,适用于引用类型,效率较高;2)通过`new ArrayList&lt;&gt;()`构造器结合`Arrays.asList()`实现类似功能;3)利用JDK8的`Stream`流式计算,支持基本数据类型数组的转换。此外,还详细讲解了列表转数组的方法,如借助`Stream`实现不同类型数组间的转换,并附带代码示例与执行结果,帮助读者深入理解两种数据结构的互转技巧。
595 1
Java 中数组Array和列表List的转换
|
12月前
|
数据挖掘 大数据 数据处理
python--列表list切分(超详细)
通过这些思维导图和分析说明表,您可以更直观地理解Python列表切分的概念、用法和实际应用。希望本文能帮助您更高效地使用Python进行数据处理和分析。
320 14
|
12月前
|
C语言 Python
[oeasy]python054_python有哪些关键字_keyword_list_列表_reserved_words
本文介绍了Python的关键字列表及其使用规则。通过回顾`hello world`示例,解释了Python中的标识符命名规则,并探讨了关键字如`if`、`for`、`in`等不能作为变量名的原因。最后,通过`import keyword`和`print(keyword.kwlist)`展示了Python的所有关键字,并总结了关键字不能用作标识符的规则。
257 9
|
安全 Java
java线程之List集合并发安全问题及解决方案
java线程之List集合并发安全问题及解决方案
1352 1
|
运维 关系型数据库 Java
PolarDB产品使用问题之使用List或Range分区表时,Java代码是否需要进行改动
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
Java API Apache
怎么在在 Java 中对List进行分区
本文介绍了如何将列表拆分为给定大小的子列表。尽管标准Java集合API未直接支持此功能,但Guava和Apache Commons Collections提供了相关API。
394 1

热门文章

最新文章

  • 1
    Java 中数组Array和列表List的转换
    595
  • 2
    JavaScript中通过array.map()实现数据转换、创建派生数组、异步数据流处理、复杂API请求、DOM操作、搜索和过滤等,array.map()的使用详解(附实际应用代码)
    557
  • 3
    通过array.reduce()实现数据汇总、条件筛选和映射、对象属性的扁平化、转换数据格式、聚合统计、处理树结构数据和性能优化,reduce()的使用详解(附实际应用代码)
    1326
  • 4
    通过array.some()实现权限检查、表单验证、库存管理、内容审查和数据处理;js数组元素检查的方法,some()的使用详解,array.some与array.every的区别(附实际应用代码)
    398
  • 5
    通过array.every()实现数据验证、权限检查和一致性检查;js数组元素检查的方法,every()的使用详解,array.some与array.every的区别(附实际应用代码)
    249
  • 6
    多维数组操作,不要再用遍历循环foreach了!来试试数组展平的小妙招!array.flat()用法与array.flatMap() 用法及二者差异详解
    160
  • 7
    别再用双层遍历循环来做新旧数组对比,寻找新增元素了!使用array.includes和Set来提升代码可读性
    186
  • 8
    Array.forEach实战详解:简化循环与增强代码可读性;Array.forEach怎么用;面对大量数据时怎么提高Array.forEach的性能
    126
  • 9
    深入理解 JavaScript 中的 Array.find() 方法:原理、性能优势与实用案例详解
    449
  • 10
    JavaScript 中通过Array.sort() 实现多字段排序、排序稳定性、随机排序洗牌算法、优化排序性能,JS中排序算法的使用详解(附实际应用代码)
    831
  • 推荐镜像

    更多