Python和Numpy

简介:

NumPyNumerical Python Extensions)是一个第三方的开源Python包,用于科学计算,其前身是1995年开始开发的基于一个用于数组运算的库,经过长时间的发展,基本上成了绝大多数Python科学计算的基础包。

NumPy主要操作的对象是同种类型元素的多维数组/矩阵,并提供大量科学计算,尤其是线性代数,简单数学,逻辑,排序,选择,I/O,傅立叶变换,基本统计,随机模拟;而标准Python库中的array.array只提供少量功能。

   

网如下简洁介绍:

  • 强大的N维数组对象及处理

  • sophisticated (broadcasting) functions 强大的函数功能,broadcasting?

  • 与C++与Fortran集成

  • 线性代数、傅立叶转换和随机数生成函数

NumPy提供了两种基本的对象,ndarray(N-dimensional array object)和ufunc(universal function object)可以对其N维数组进行计算处理.


基础结构

多维数组ndarray

NumPy的主要对象是同质多维数组,矩阵。所为同质即其所有元素的类型都相同。其中维度称作轴axes,轴的数目称为秩rank

ndarray.ndim:数组维度的数量,rank , 如2维数组的rank = 2;

ndarry.shape :  数组的维度,对于n行m列的矩阵,shape则是(n,m), 所以shape元组的长度即是rank

ndarry.size:多维数组总个数,如2*3矩阵size=6


内存结构

多维数组的内存结构分为两大对象,一块用来保存数据区域,一块用来描述元数据类型的dtype

640?wx_fmt=jpeg

多维数组创建

直接从标准数组创建:

b=np.array( [(1,2),(3,4)])

创建复数类型:

640?wx_fmt=jpeg

zeros:创建全部由0组成的数组

ones:则创建一个由1组成的数组

empty:随机由内存中数据生成

arange:安装指定规则生成

linspace:浮点数生成数组

640?wx_fmt=jpeg

简单方便,最后linspace则是针对浮点数,参数则是希望得到的元素个数,而非arange中的步长作为参数。


函数及操作

数组/矩阵基本操作

对于数组元素级别的操作:

640?wx_fmt=jpeg

包括数组元素的相减,自己元素*2,或者平方,或者进行判断操作。


同样对于,多维数组/矩阵也同样适用:

640?wx_fmt=jpeg

对于矩阵的简单基本操作我们已经可以看出NumPy的灵活方便。


对于我们关心的矩阵乘法,则需要使用函数dot

640?wx_fmt=jpeg

如上,a*b只是简单的对应元素相乘,dot则是真正矩阵乘法。另外,多维数组也支持子操作,如a *= 2;

其他通用函数

其他通用函数同样可以作用于多维数组/矩阵,如sin,cos,exp,average,cov,ceil, transpose等


all: 测试是否True

640?wx_fmt=jpeg

类似C语言风格,非零即True


soft用指定算法对数组进行排序,算法包括了quicksort, mergesort, heapsort等,默认快排序,对于排序算法的性能,参考如下:

640?wx_fmt=jpeg

总体来说,做到了简单,灵活。

640?wx_fmt=jpeg

sort甚至可以对结构化数组进行排序:

640?wx_fmt=jpeg

简直方便到让人流口水。。。


transpose矩阵转置

640?wx_fmt=jpeg


高阶功能

Broadcasting

Numpy中引入的广播broadcasting用来解决两个形状不同的矩阵阵列如何进行扩展从而可以继续进行数学计算的机制。简单来说,较小的阵列“广播”扩展到较大的阵列相同的形状维度,使得它们可以对等进行输血计算,广播提供过了一种向量化的操作方式,并且Python的广播不需要数据复制,执行效率高效。


具体的广播规则则是让所有输入数组都向其中shape最长的数组看齐,shape中不足的部分都通过在前面加1补齐:

640?wx_fmt=jpeg

同样,在矩阵乘法中:

640?wx_fmt=jpeg


傅立叶变换/分析

傅立叶变换,表示能将满足一定条件的某个函数表示成三角函数或者它们的积分的线性组合,在各个学科中有广泛的应用。


Numpy中包含了标准FFT(一维,一维离散,两维,N维度等),实际FFT等等。这里自动过滤。


下面看一个官网的一维离散傅立叶变换

640?wx_fmt=jpeg

运行生成的图像为:

640?wx_fmt=jpeg

简单财务函数

Numpy提供了一些简单的金融财务的函数,如计算现值pv,终值fv,贷款利息,收益率等比较基本功能,可以自行查阅API文档。

线性代数

这个应该作为多维数组/矩阵框架的基本款吧?

640?wx_fmt=jpeg

还有其他计算特征值,范数,行列式,以及求解矩阵方程式或线性标量方程组,最小二乘法,求逆等。


我们来看一下我们感兴趣的最小二乘法吧:

lstsq:求解最小二乘解返回到线性矩阵方程


如 求适合直线,y = mx + c

x = [0,     1,    2,    3]

y = [-1, 0.2, 0.9, 2.1]

640?wx_fmt=jpeg

并且可以用简单代码生成拟合图像:

640?wx_fmt=jpeg

运行后,生成如下拟合图:

640?wx_fmt=jpeg


统计/随机抽样

统计与随机分布也是必不可少的函数,包含了随机数据random, sample; 分布beta, binomial, 指数分布,正态分布,泊松分布等等几十种,统计函数如标准方差std,协方差等等。


当然,我们也重点看看我们感(neng)兴(kan)趣(dong)的正态/高斯分布吧:


random.normal(loc, scale, size): 高斯分布绘制随机样本


请自行查阅维基百科:http://en.wikipedia.org/wiki/Normal_distribution


我们来看一下吧:

640?wx_fmt=jpeg

生成的图形如下:

640?wx_fmt=jpeg
目录
相关文章
|
22天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
38 2
|
28天前
|
存储 数据处理 Python
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第27天】在科学计算和数据分析领域,Python凭借简洁的语法和强大的库支持广受欢迎。NumPy和SciPy作为Python科学计算的两大基石,提供了高效的数据处理和分析工具。NumPy的核心功能是N维数组对象(ndarray),支持高效的大型数据集操作;SciPy则在此基础上提供了线性代数、信号处理、优化和统计分析等多种科学计算工具。结合使用NumPy和SciPy,可以显著提升数据处理和分析的效率,使Python成为科学计算和数据分析的首选语言。
32 3
|
1月前
|
数据采集 数据可视化 数据处理
如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`)
本文介绍了如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`),加载历史数据,计算均线和其他技术指标,实现交易逻辑,记录和可视化交易结果。示例代码展示了如何根据均线交叉和价格条件进行开仓、止损和止盈操作。实际应用时需注意数据质量、交易成本和风险管理。
50 5
|
29天前
|
存储 机器学习/深度学习 算法
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第26天】NumPy和SciPy是Python科学计算领域的两大核心库。NumPy提供高效的多维数组对象和丰富的数学函数,而SciPy则在此基础上提供了更多高级的科学计算功能,如数值积分、优化和统计等。两者结合使Python在科学计算中具有极高的效率和广泛的应用。
46 2
|
2月前
|
机器学习/深度学习 并行计算 大数据
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧2
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
79 10
|
2月前
|
机器学习/深度学习 数据采集 算法
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
【10月更文挑战第5天】随着数据科学和机器学习领域的快速发展,处理大规模数据集的能力变得至关重要。Python凭借其强大的生态系统,尤其是NumPy、Pandas和SciPy等库的支持,在这个领域占据了重要地位。本文将深入探讨这些库如何帮助科学家和工程师高效地进行数据分析,并通过实际案例来展示它们的一些高级应用。
57 0
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
|
2月前
|
机器学习/深度学习 算法 数据挖掘
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧1
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
51 5
|
2月前
|
索引 Python
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧1
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
93 4
|
2月前
|
机器学习/深度学习 算法 数据可视化
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧2
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
42 1
|
2月前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
43 1