厉害了,numpy!!!

简介: 厉害了,numpy!!!

几乎所有使用Python处理分析数据的人都用过Pandas,因为实在太方便了,就像Excel一样,但你知道Pandas是基于Numpy开发出来的吗?

Pandas和Numpy的关系类似于国产安卓系统和原生安卓,Numpy提供底层数据结构和算法,搭配数据面板的分析模式,缔造了Pandas。

某种意义上来说,Numpy是Python数据科学领域金字塔尖的库。

有人这样问过。 52e7b92ad299ae71f690591ce639614b.png

这并不让人意外,虽然Numpy没有Pandas知名度高,但Numpy的性能之强大、应用之广会让很多人咋舌,甚至Numpy的论文登上了Nature杂志。 5212878d5b02cb4da134c90de804c5dc.png

阅读和下载地址:https://www.nature.com/articles/s41586-020-2649-2

不清楚底细的人可能会问,到底什么是Numpy?

Numpy是专门用于多维数组和矩阵计算的Python库,Numpy的强大不在于有多少函数方法,而在于其多维数组和矩阵的计算能力和运行效率。

d325f7d0c5347b461886b6325983122b.png

众所周知的商业软件matlab,也是基于多维数组和矩阵计算。

多维数组和矩阵计算最主要的特点是快,非常快。

知道线性代数吧,为了提高性能,有专门的线性代数库(如BLAS、LAPACK、Intel MKL等)对底层的矩阵运算进行了高度优化。

另外,CPU、GPU这些硬件对矩阵运算有很好的支持。

比如说,GPU具有大量的并行处理核心,非常适合执行大规模的矩阵运算。通过使用CUDA或OpenCL等技术,可以充分发挥GPU的并行计算能力。 87f71336610e2847e1146909d951a29e.png

在Numpy创建和使用多维数组很简单,使用array方法即可。 e9b9ce0d4624d6ee38cc04d464630bbd.png

除了多维数组和矩阵计算,从Numpy本身来说,它以下4大特点确保了它的重要地位:

1、可以和Pandas等多种库进行交互

2、拥有各种科学计算API,任你调用

3、Numpy基于C语言开发,速度和C一样快

4、Numpy在Python中使用,操作和Python一样简洁

接下来,我们看看有哪些Python库的底层依赖库是numpy。

依赖代表这些库需要numpy支持才能运行,某种意义上来说,某个库作为依赖库越多代表它越重要。

以numpy作为依赖的部分python库:

  1. Pandas:最出名的数据处理和分析库,使用基于NumPy 的二维数组来分析数据。

470ea33e5f14496a45870da1d9c855c2.png

  1. SciPy:类似于Matlab的数学和工程计算库,SciPy 库建立在 NumPy 之上,使用多维数组来计算。 90a186db243c1882e2ad7126621a2133.png
  2. Matplotlib:Python中功能最齐全的可视化库,也是很多其他可视化库的依赖,它依赖 NumPy 进行数学运算以生成图形。 f35089a6455352439b6bf2332848555a.png
  3. Scikit-learn:拥有各类算法的机器学习库,使用 NumPy 进行数据的快速处理和算法实现。 cc1faeeb15b1c25a9191601645c03418.png
  4. StatsModels:专门用于统计分析的算法库,依赖 NumPy 进行数值计算。 6b5825987a4cde25036ce754af616bd7.png
  5. TensorFlow PyTorch:最最出名的两个深度学习框架,各种大模型都是靠它们跑出来的,但是它们在底层使用 NumPy 进行张量操作。 ad3a947cfa8e2c7ce655c00ac864ad0e.png

63d2a11260f8ce385e429a0b16a0ea10.png

  1. OpenCV:家喻户晓的计算机视觉,使用 NumPy 数组进行图像处理。 37b3f42ca1b20e2575e5a1bb88089852.png
  2. NetworkX:图形网络分析库,用于复杂网络创建、操作和使用 ,使用NumPy 进行网络分析。 37e2ff249c041dde99d1454be25867fc.png

可以看到,很多主流的数据科学、机器学习、深度学习库都是靠numpy依赖,基于多维数组来进行计算,可见numpy有多么的重要,说它是数据科学的顶级库也不为过。

以下是一些numpy的基础函数和方法介绍:

  1. np.array(object, dtype=None, copy=True, order='K', subok=False, ndmin=0):
  • 创建一个 NumPy 数组。
  1. np.zeros(shape, dtype=float, order='C'):
  • 返回一个给定形状和数据类型的数组,其中所有元素都为 0。
  1. np.ones(shape, dtype=None, order='C'):
  • 返回一个给定形状和数据类型的数组,其中所有元素都为 1。
  1. np.empty(shape, dtype=float, order='C'):
  • 返回一个未初始化的数组,其元素值是随机的。
  1. np.arange(start, stop=None, step=1, dtype=None):
  • 返回一个与 Python 的 range 类似的数组,包含从 start 开始到 stop 结束(不包括 stop)的值,步长为 step
  1. np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0):
  • 返回一个数组,其中包含 num 个从 startstop 的等间隔的点。
  1. np.reshape(a, newshape, order='C'):
  • 将数组 a 重塑为 newshape 指定的形状。
  1. np.transpose(a, axes=None):
  • 转置数组,可选地按照 axes 指定的轴顺序。
  1. np.dot(a, b, out=None):
  • 矩阵乘法,计算两个数组的点积。
  1. np.vstack(tup):
  • 垂直堆叠数组,等价于 np.concatenate(tup, axis=0)
目录
相关文章
|
开发工具 git Perl
Argo CD 入门扫盲使用(二)
Argo CD 入门扫盲使用
448 0
|
监控 Java API
Spring Cloud 2021.0.1 实践 Resilience4J
Spring Cloud CircuitBreaker 提供了跨不同断路器实现的抽象。它提供了在您的应用程序中使用的一致 API,让您(开发人员)选择最适合您的应用程序需求的断路器实现。
1789 0
Spring Cloud 2021.0.1 实践 Resilience4J
Cesium添加3DTile
这篇文章介绍了如何在Cesium中添加3DTile内容,以增强三维地理空间数据的表现,并提供了实现的具体步骤和代码示例。
372 1
Cesium添加3DTile
|
8月前
|
存储 SQL 人工智能
DeepSeek开源周第五弹之二!Smallpond:构建于3FS之上的轻量级数据处理框架,高效处理PB级数据
Smallpond 是 DeepSeek 开源的轻量级数据处理框架,基于 DuckDB 和 3FS 构建,支持 PB 级数据处理,提供高性能的数据加载、查询和转换功能,适合大规模数据预处理和实时分析。
615 1
DeepSeek开源周第五弹之二!Smallpond:构建于3FS之上的轻量级数据处理框架,高效处理PB级数据
|
9月前
|
人工智能 算法 Java
零门槛、百万token免费用,即刻拥有DeepSeek-R1满血版,还有实践落地调用场景等你来看
DeepSeek 是热门的推理模型,能在少量标注数据下显著提升推理能力,尤其擅长数学、代码和自然语言等复杂任务。本文涵盖四种部署方案,可以让你快速体验云上调用 DeepSeek-R1 满血版的 API 及部署各尺寸模型的方式,无需编码,最快 5 分钟、最低 0 元即可实现
|
11月前
|
调度 云计算 芯片
云超算技术跃进,阿里云牵头制定我国首个云超算国家标准
近日,由阿里云联合中国电子技术标准化研究院主导制定的首个云超算国家标准已完成报批,不久后将正式批准发布。标准规定了云超算服务涉及的云计算基础资源、资源管理、运行和调度等方面的技术要求,为云超算服务产品的设计、实现、应用和选型提供指导,为云超算在HPC应用和用户的大范围采用奠定了基础。
180013 22
|
移动开发 编解码 数据可视化
低代码可视化-uniapp SliderRange区间组件-代码生成器
SliderRange区间组件是一种用户界面元素,允许用户通过拖动滑块选择数值范围。组件支持微信小程序、H5和App,具有高度可定制性、响应式设计和多种事件处理功能。适用于价格筛选、音量调节等场景。代码实现包括滑动区域、滑块、事件处理等部分,支持可视化配置步长、颜色等属性。使用时需注意选择合适步长、提供清晰标签和考虑无障碍设计。
376 0
|
应用服务中间件 网络安全 数据安全/隐私保护
SSL证书在IIS上部署使用
该文介绍了如何在IIS上部署SSL证书以实现HTTPS访问。首先建议使用nginx,但若需使用IIS,需有SSL证书(fullchain.pem和privkey.pem)并熟悉IIS操作。文中提供了两种证书转换方法:已有openssl,使用命令`openssl pkcs12 -export`生成.pfx文件;无openssl,通过Python脚本(pyOpenSSL v23.2.0)转换。转换后的.pfx文件导入Windows,选择“本地用户”并输入密码。最后在IIS中绑定证书,测试https访问应能正常工作。
898 0
|
关系型数据库 MySQL 大数据
教你使用Python玩转MySQL数据库,大数据导入不再是难题!
教你使用Python玩转MySQL数据库,大数据导入不再是难题!
306 1
|
网络协议 Unix Linux
TCP 三次握手、四次断开
TCP 三次握手、四次断开