Python中的NumPy库详解

简介: Python中的NumPy库详解

Python中的NumPy库详解
NumPy(Numerical Python)是Python中一个非常重要的科学计算库,它提供了高性能的多维数组对象及其相关操作。NumPy数组是Python中列表(list)的扩展,但它在存储和处理大型数据集时具有更高的效率和灵活性。NumPy还提供了大量的数学函数库,这些函数直接对数组进行操作,无需编写循环,从而大大提高了代码的执行速度。在本文中,我们将深入探讨NumPy的基本用法、高级特性以及在实际应用中的广泛场景,并通过丰富的代码示例来展示其强大功能。

一、NumPy基础

1. 安装NumPy

在使用NumPy之前,首先需要确保它已经被安装在你的Python环境中。你可以通过pip命令来安装NumPy:

pip install numpy

2. 导入NumPy

在Python脚本或交互式环境中,通过以下方式导入NumPy库,并通常将其重命名为np以便于调用:

import numpy as np

3. 创建NumPy数组

NumPy提供了多种创建数组的方法,包括从Python列表转换、使用预定义的函数(如np.zeros、np.ones、np.arange等)以及从文件中加载数据等。
从列表创建数组:

arr = np.array([1, 2, 3, 4, 5]) 
print(arr) 
# 输出: [1 2 3 4 5]

使用np.zeros和np.ones:

zeros_arr = np.zeros(5) # 创建一个长度为5的全0数组 
ones_arr = np.ones((3, 4)) # 创建一个3x4的全1矩阵 
print(zeros_arr) 
# 输出: [0. 0. 0. 0. 0.] 
print(ones_arr) 
# 输出: 
# [[1. 1. 1. 1.] 
# [1. 1. 1. 1.] 
# [1. 1. 1. 1.]]

使用np.arange:

arange_arr = np.arange(10) # 从0开始到10(不包括10)的整数数组 
print(arange_arr) 
# 输出: [0 1 2 3 4 5 6 7 8 9]

二、NumPy数组的基本操作

1. 数组的形状和维度

NumPy数组具有形状(shape)和维度(dimension)的概念。形状是一个表示数组在每个维度上大小的元组,而维度则是数组的“深度”或“层数”。

arr = np.array([[1, 2, 3], [4, 5, 6]]) 
print(arr.shape) # 输出: (2, 3) 
print(arr.ndim) # 输出: 2

2. 数组索引和切片

NumPy数组的索引和切片与Python列表类似,但支持多维索引。

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) 
print(arr[1, 2]) # 输出: 6 
print(arr[0:2, 1:]) # 输出: [[2 3] 
# [5 6]]

3. 数组运算

NumPy支持数组间的元素级运算,这使得对大型数据集进行数学操作变得非常高效。

a = np.array([1, 2, 3]) 
b = np.array([4, 5, 6]) 
print(a + b) # 元素级加法 
# 输出: [5 7 9] 

print(a * b) # 元素级乘法 
# 输出: [ 4 10 18]

三、NumPy的高级特性

1. 广播(Broadcasting)

广播是NumPy中一个强大的功能,它允许NumPy在执行算术运算时自动扩展数组的形状,以匹配另一个数组的形状。

a = np.array([1, 2, 3]) 
b = np.array([[4], [5], [6]]) 
print(a + b) # 通过广播进行元素级加法 
# 输出: 
# [[5 6 7

1. ndarray对象

NumPy的核心是ndarray对象,它是一个多维数组,与Python的内置列表(list)相比,ndarray在存储效率和性能上具有显著优势。ndarray中的元素在内存中连续存储,且每个元素的大小相同,这使得NumPy能够利用现代计算机的缓存和内存带宽,实现高效的数组计算。
创建ndarray:

import numpy as np 

# 使用array函数从Python列表创建ndarray 
arr1 = np.array([1, 2, 3, 4, 5]) 
print(arr1) 
print(type(arr1)) 

# 创建特定形状和类型的ndarray 
arr2 = np.zeros((3, 4), dtype=int) # 3x4的整数型零矩阵 
print(arr2) 

arr3 = np.ones((2, 3), dtype=float) # 2x3的浮点型全1矩阵 
print(arr3) 

# 使用arange和linspace创建具有特定值的数组 
arr4 = np.arange(0, 10, 2) # 从0到10(不包括10),步长为2的数组 
print(arr4) 

arr5 = np.linspace(0, 10, 5) # 从0到10,生成5个等间距的浮点数的数组 
print(arr5)

2. 数据类型(dtype)

在NumPy中,dtype是描述数组中元素类型的一个对象。通过指定dtype,可以控制数组中元素的大小和类型,这对于节省内存和提高计算效率至关重要。
示例:

# 显式指定dtype 
arr_int = np.array([1, 2, 3], dtype=np.int32) 
print(arr_int.dtype) 

arr_float = np.array([1.1, 2.2, 3.3], dtype=np.float64) 
print(arr_float.dtype)

3. 数组索引与切片

NumPy数组支持类似于Python列表的索引和切片操作,但由于NumPy数组是多维的,因此其索引和切片操作更加灵活和强大。
示例:

# 一维数组的索引和切片 
arr = np.array([1, 2, 3, 4, 5]) 
print(arr[2]) # 索引操作 
print(arr[1:4]) # 切片操作 

# 二维数组的索引和切片 
arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) 
print(arr2d[1, 2]) # 索引操作,访问第二行第三列的元素 
print(arr2d[0:2, 1:]) # 切片操作,访问前两行的后两列
相关文章
|
1月前
|
存储 Java 数据处理
(numpy)Python做数据处理必备框架!(一):认识numpy;从概念层面开始学习ndarray数组:形状、数组转置、数值范围、矩阵...
Numpy是什么? numpy是Python中科学计算的基础包。 它是一个Python库,提供多维数组对象、各种派生对象(例如掩码数组和矩阵)以及用于对数组进行快速操作的各种方法,包括数学、逻辑、形状操作、排序、选择、I/0 、离散傅里叶变换、基本线性代数、基本统计运算、随机模拟等等。 Numpy能做什么? numpy的部分功能如下: ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组 用于对整组数据进行快速运算的标准数学函数(无需编写循环)。 用于读写磁盘数据的工具以及用于操作内存映射文件的工具。 线性代数、随机数生成以及傅里叶变换功能。 用于集成由C、C++
303 0
|
1月前
|
Java 数据处理 索引
(numpy)Python做数据处理必备框架!(二):ndarray切片的使用与运算;常见的ndarray函数:平方根、正余弦、自然对数、指数、幂等运算;统计函数:方差、均值、极差;比较函数...
ndarray切片 索引从0开始 索引/切片类型 描述/用法 基本索引 通过整数索引直接访问元素。 行/列切片 使用冒号:切片语法选择行或列的子集 连续切片 从起始索引到结束索引按步长切片 使用slice函数 通过slice(start,stop,strp)定义切片规则 布尔索引 通过布尔条件筛选满足条件的元素。支持逻辑运算符 &、|。
155 0
|
2月前
|
存储 人工智能 测试技术
如何使用LangChain的Python库结合DeepSeek进行多轮次对话?
本文介绍如何使用LangChain结合DeepSeek实现多轮对话,测开人员可借此自动生成测试用例,提升自动化测试效率。
442 125
如何使用LangChain的Python库结合DeepSeek进行多轮次对话?
|
2月前
|
监控 数据可视化 数据挖掘
Python Rich库使用指南:打造更美观的命令行应用
Rich库是Python的终端美化利器,支持彩色文本、智能表格、动态进度条和语法高亮,大幅提升命令行应用的可视化效果与用户体验。
214 0
|
1月前
|
数据可视化 关系型数据库 MySQL
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
本文详解基于Python的电影TOP250数据可视化大屏开发全流程,涵盖爬虫、数据存储、分析及可视化。使用requests+BeautifulSoup爬取数据,pandas存入MySQL,pyecharts实现柱状图、饼图、词云图、散点图等多种图表,并通过Page组件拖拽布局组合成大屏,支持多种主题切换,附完整源码与视频讲解。
219 4
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
|
1月前
|
传感器 运维 前端开发
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
本文解析异常(anomaly)与新颖性(novelty)检测的本质差异,结合distfit库演示基于概率密度拟合的单变量无监督异常检测方法,涵盖全局、上下文与集体离群值识别,助力构建高可解释性模型。
304 10
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
|
3月前
|
运维 Linux 开发者
Linux系统中使用Python的ping3库进行网络连通性测试
以上步骤展示了如何利用 Python 的 `ping3` 库来检测网络连通性,并且提供了基本错误处理方法以确保程序能够优雅地处理各种意外情形。通过简洁明快、易读易懂、实操性强等特点使得该方法非常适合开发者或系统管理员快速集成至自动化工具链之内进行日常运维任务之需求满足。
235 18
|
3月前
|
机器学习/深度学习 API 异构计算
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
JAX是Google开发的高性能数值计算库,旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API,还引入了自动微分、GPU/TPU加速和即时编译(JIT)等关键功能,显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景,为Python在高性能计算领域开辟了新路径。
382 0
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
|
3月前
|
数据采集 存储 Web App开发
Python爬虫库性能与选型实战指南:从需求到落地的全链路解析
本文深入解析Python爬虫库的性能与选型策略,涵盖需求分析、技术评估与实战案例,助你构建高效稳定的数据采集系统。
365 0
|
3月前
|
存储 数据采集 数据处理
Pandas与NumPy:Python数据处理的双剑合璧
Pandas与NumPy是Python数据科学的核心工具。NumPy以高效的多维数组支持数值计算,适用于大规模矩阵运算;Pandas则提供灵活的DataFrame结构,擅长处理表格型数据与缺失值。二者在性能与功能上各具优势,协同构建现代数据分析的技术基石。
352 0

推荐镜像

更多