Python NumPy 高级教程:结构化数组
在 NumPy 中,结构化数组允许我们创建具有复杂数据类型的数组,类似于表格或数据库中的行。这对于处理异质数据集非常有用。在本篇博客中,我们将深入介绍 NumPy 中的结构化数组,并通过实例演示如何创建、访问和操作结构化数组。
1. 创建结构化数组
结构化数组可以通过指定每个字段的名称和数据类型来创建。
import numpy as np
# 定义数据类型
dtype = np.dtype([('name', 'S10'), ('age', int), ('height', float)])
# 创建结构化数组
data = np.array([('Alice', 25, 5.6), ('Bob', 30, 6.0)], dtype=dtype)
print(data)
2. 访问结构化数组的字段
可以通过字段名称访问结构化数组的各个字段。
# 访问结构化数组的字段
print(data['name']) # 输出:['Alice' 'Bob']
print(data['age']) # 输出:[25 30]
print(data['height']) # 输出:[5.6 6. ]
3. 修改结构化数组的值
通过索引和字段名称,可以修改结构化数组的各个字段的值。
# 修改结构化数组的值
data['age'][0] = 26
data['height'][1] = 6.2
print(data)
4. 多维结构化数组
结构化数组可以是多维的,每个维度可以有不同的数据类型。
# 多维结构化数组
dtype_multi = np.dtype([('matrix', [('row', int), ('column', int)]), ('value', float)])
data_multi = np.array([((1, 2), 3.5), ((3, 4), 1.2)], dtype=dtype_multi)
print(data_multi)
5. 使用嵌套字段
结构化数组支持嵌套字段,可以方便地处理嵌套结构。
# 使用嵌套字段
dtype_nested = np.dtype([('info', [('name', 'S10'), ('age', int)]), ('height', float)])
data_nested = np.array([(('Alice', 25), 5.6), (('Bob', 30), 6.0)], dtype=dtype_nested)
print(data_nested)
6. 结构化数组的排序
可以使用 np.sort 函数对结构化数组进行排序。
# 结构化数组的排序
sorted_data = np.sort(data, order='age')
print(sorted_data)
7. 结构化数组的条件筛选
可以使用条件来筛选结构化数组中的数据。
# 结构化数组的条件筛选
filtered_data = data[data['age'] > 26]
print(filtered_data)
8. 结构化数组与 Pandas DataFrame 的转换
结构化数组可以方便地与 Pandas DataFrame 进行转换。
import pandas as pd
# 结构化数组转为 DataFrame
df = pd.DataFrame(data)
print(df)
9. 总结
结构化数组是 NumPy 中用于处理异质数据的重要工具,通过定义复杂的数据类型,我们可以创建具有不同字段的数组,类似于表格或数据库中的行。结构化数组提供了访问、修改、排序和条件筛选数据的灵活性,同时也方便与 Pandas DataFrame 进行交互。希望本篇博客能够帮助你更好地理解和运用 NumPy 中的结构化数组功能。