数据分析--NumPy

简介: 数据分析--NumPy

多维数组对象:ndarray对象


ndarray对象保存同一类型的数据,访问方式类似于列表,通过整数下标进行索引
属性
- shape 返回一个元组,用于表示ndarray各个维度的长度,
- 元组的长度为数的维度,
- 元组的每一个数值代表ndarray每一个维度的长度


520339bad443405ba8a8b12a669f7aa2.png

ndim ndarray的维度

size ndarray对象中的所有元素个数 相当于各个维度的长度乘积

dtype ndarray 对象中储存的数据类型

itemsize ndarra对象中每个元素的字节数


d5c445e5f67a41caaf053ce1dd4e0605.png


ndarray对象的创建

  • array 将输入的序列型数据(list、tuple、ndarray等)转换成ndarray对象,并返回一个新对象ndarray对象


7e80f15755b0435a8454c76b8ea64eb4.png


asarray 将输入的序列(list,tuple等)转换成ndarray对象,并返回新对象,但是,当输入的序列是ndarray对象时,并不会产生新的ndarray对象,指向同一个地址值


d7fbc9a948d541f593358030a0cd56b7.png

arange 根据输入的参数,返回等间隔的ndarray对象


adb9c5c308114f7aa6573aee1c67e023.png


ones 指定shape,创建一个全为1 的数组

ones_like 以另一个ndarray对象的shape为定的shape,创建全为1 的数组


036ae15e36cc415c89519d7cacf0b283.png

zeros 指定shape创建一个全为0的数组

zeros_like 以另一个ndarray对象的shape为定的shape,创建全为0 的数组


47af0dfc987a458c88a26e3fddd760ca.png


empty 指定创建新数组,只分配空间不填充值,默认数据类型为float64

empty_like以另一个ndarray对象的shape为定的shape,建新数组,只分配空间不填充值


7a8fedd07c0e4f1c8bd88755eb369603.png


eye,identity 创建nxn的单位矩阵,对角元素为1,其余为0


96852fa5f90c4b06812259cf021df0f0.png


ndarray对象的数据类型


  • 整数
  • 浮点数
  • 复数
  • 布尔值
  • Python对象
  • 字符串


ndarray对象的索引,切片和迭代


一维的ndarray对象的索引、切片、和迭代类似于python中对列表的操作


e363060b4d614c929e1f772106809028.png


多维的ndarray对象


7dfacc78974748e5a0d26aca17344270.png


针对ndarray对象的迭代,一维数组与python的列表相同,多维数组则针第一个维度进行迭代,也可以通过 ndarray对象的flat属性实现对ndarray对象的每个元素的迭代


eab3452fff1c4f77b3ae7546711a27dd.png


ndarray对象的shape操作


ndarray对象的shape可以通过多种命令更改,一种是对原来ndarray进行改变,一种是返回一个新对象,不改变原来的数据


reshape 将ndarray对象的shape按照传入的参数进行修改,返回一个新的ndarray对象

reval 将多维的ndarray对象的shape改为一维的,返回一个一维的ndarray的对象

T 返回ndarray对象转置后的结果

resize 将ndarray对象的shape按照传入的参数进行修改


87fb4450714b441f89dfcebd1a99d368.png

ndarray对象的基础操作


对于一些用于标量的算数运算符,NumPy可以通过广播的形式作用到ndarray对象的每一个元素上,返回一个或多个新矢量


不足


本文所用的都是比较基础的函数,仍有许多函数不曾涉及




相关文章
|
30天前
|
数据采集 数据挖掘 数据处理
Python数据分析:Numpy、Pandas高级
在上一篇博文中,我们介绍了Python数据分析中NumPy和Pandas的基础知识。本文将深入探讨NumPy和Pandas的高级功能,并通过一个综合详细的例子展示这些高级功能的应用。
|
30天前
|
数据采集 数据挖掘 数据处理
Python数据分析:Numpy、Pandas基础
本文详细介绍了 Python 中两个重要的数据分析库 NumPy 和 Pandas 的基础知识,并通过一个综合的示例展示了如何使用这些库进行数据处理和分析。希望通过本篇博文,能更好地理解和掌握 NumPy 和 Pandas 的基本用法,为后续的数据分析工作打下坚实的基础。
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
【7月更文挑战第12天】Python的Pandas和NumPy库助力高效数据处理。Pandas用于数据清洗,如填充缺失值和转换类型;NumPy则擅长数组运算,如元素级加法和矩阵乘法。结合两者,可做复杂数据分析和特征工程,如产品平均销售额计算及销售额标准化。Pandas的时间序列功能,如移动平均计算,进一步增强分析能力。掌握这两者高级技巧,能提升数据分析质量和效率。
42 4
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。
【7月更文挑战第5天】了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。数据预处理涉及缺失值(dropna(), fillna())和异常值处理。使用describe()进行统计分析,通过Matplotlib和Seaborn绘图。回归和分类分析用到Scikit-learn,如LinearRegression和RandomForestClassifier。
60 3
|
2月前
|
数据采集 数据可视化 数据挖掘
数据分析入门:用Python和Numpy探索音乐流行趋势
数据分析入门:用Python和Numpy探索音乐流行趋势
|
2月前
|
数据采集 数据挖掘 数据处理
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
【7月更文挑战第14天】Python的Pandas和NumPy库是数据分析的核心工具。Pandas以其高效的数据处理能力,如分组操作和自定义函数应用,简化了数据清洗和转换。NumPy则以其多维数组和广播机制实现快速数值计算。两者协同工作,如在DataFrame与NumPy数组间转换进行预处理,提升了数据分析的效率和精度。掌握这两者的高级功能是提升数据科学技能的关键。**
27 0
|
2月前
|
数据挖掘 数据处理 决策智能
Python 数据分析工具箱:深挖 Pandas 与 NumPy 高级功能,驱动智能决策
【7月更文挑战第12天】Python的Pandas和NumPy是数据分析的基石。Pandas提供灵活的数据结构如DataFrame,用于高效处理关系型数据,而NumPy则以多维数组和科学计算功能著称。两者结合,支持数据合并(如`pd.merge`)、时间序列分析(`pd.to_datetime`)和高级数组运算。通过掌握它们的高级特性,能提升数据分析效率,应用于各领域,如金融风险评估、市场分析和医疗预测,助力数据驱动的决策。学习和熟练运用Pandas与NumPy是成为出色数据分析师的关键。
39 0
|
2月前
|
数据采集 数据挖掘 大数据
Pandas是Python数据分析的核心库,基于NumPy,提供DataFrame结构处理结构化数据
【7月更文挑战第5天】Pandas是Python数据分析的核心库,基于NumPy,提供DataFrame结构处理结构化数据。它支持缺失值处理(dropna()、fillna())、异常值检测(Z-Score、IQR法)和重复值管理(duplicated()、drop_duplicates())。此外,数据转换包括类型转换(astype())、数据标准化(Min-Max、Z-Score)以及类别编码(get_dummies())。这些功能使得Pandas成为大数据预处理的强大工具。
30 0
|
4月前
|
SQL 数据采集 数据挖掘
构建高效的Python数据处理流水线:使用Pandas和NumPy优化数据分析任务
在数据科学和分析领域,Python一直是最受欢迎的编程语言之一。本文将介绍如何通过使用Pandas和NumPy库构建高效的数据处理流水线,从而加速数据分析任务的执行。我们将讨论如何优化数据加载、清洗、转换和分析的过程,以及如何利用这些库中的强大功能来提高代码的性能和可维护性。
|
4月前
|
存储 并行计算 数据挖掘
Python中的NumPy库:科学计算与数据分析的基石
Python中的NumPy库:科学计算与数据分析的基石
88 0