《Python数据分析》一2.4 NumPy的数值类型

简介:

本节书摘来自异步社区《Python数据分析》一书中的第2章,第2.4节,作者【印尼】Ivan Idris,更多章节内容可以访问云栖社区“异步社区”公众号查看

2.4 NumPy的数值类型

Python自身虽然支持整型、浮点型和复数型,但对于科学计算来说,还远远不够。现实中,我们仍然需要更多的数据类型,来满足在精度和存储大小方面的各种不同的要求。为此,NumPy提供了更加丰富的数据类型。注意,NumPy跟数学运算有关的数据类型的名称都以数字结尾。而这个数字指示了该类型的变量所占用的二进制位数。表2-1(改编自《NumPy用户指南》)概述了NumPy的各种数值类型。


354ed3af904e2e59b12ae6acbdf1dd2da92b6a32

每一种数据类型都有相应的转换函数(请参考本书代码包中的numericaltypes.py文件),如下所示:

In: float64(42)
Out: 42.0
In: int8(42.0)
Out: 42
In: bool(42)
Out: True
In: bool(0)
Out: False
In: bool(42.0)
Out: True
In: float(True)
Out: 1.0
In: float(False)
Out: 0.0

许多函数都带有一个指定数据类型的参数,该参数通常是可选的:

In: arange(7, dtype=uint16)
Out: array([0, 1, 2, 3, 4, 5, 6], dtype=uint16)

谨记:不允许把复数类型转化成整型。当你企图进行这种转换时,将会触发TypeError错误,就像下面这样:

In: float(42.0 + 1.j)
Traceback (most recent call last):
 File "numericaltypes.py", line 45, in 
   print float(42.0 + 1.j)
TypeError: can't convert complex to float

同样,也不允许把复数转化成浮点数。另外,复数的分量j是其虚部的系数。不过,允许把浮点数转换成复数,如complex(1.0)是合法的。复数的实部和虚部分别使用real()函数和imag()函数提取。

2.4.1 数据类型对象

数据类型对象是numpy.dtype类的实例。数组是一种数据类型。严格来讲,NumPy数组中的每个元素都要具有相同的数据类型。数据类型对象表明了数据占用的字节数。所占用字节的具体数目一般存放在类dtype(详见dtypeattributes.py文件)的itemsize属性中。

In: a.dtype.itemsize
Out: 8

2.4.2 字符码

NumPy之所以提供字符码,是为了与其前身Numeric向后兼容。一般不建议使用字符码,这里为什么又提供这些代码呢?因为我们会在许多地方碰到它们,但是,编写代码时应当使用dtype对象。表2-2展示了一些数据类型及其相应的字符码。


57b7788cbf9f5819b23d6cae9261d55a5cda00ff

下面的代码(代码取自本书代码包中的charcodes.py文件)将生成一个单精度浮点型的数组:

In: arange(7, dtype='f')
Out: array([ 0., 1., 2., 3., 4., 5., 6.], dtype=float32)`

类似地,下列代码将创建一个负数类型的数组:

In: arange(7, dtype='D')
Out: array([ 0.+0.j, 1.+0.j, 2.+0.j, 3.+0.j, 4.+0.j, 5.+0.j, 6.+0.j])

2.4.3 Dtype构造函数

创建数据类型时,手段有很多,下面以浮点型数据为例进行说明(以下代码取自本书代码包中的dtypeconstructors.py文件)。

可以用Python自带的常规浮点型,代码如下所示:`

 In: dtype(float)
  Out: dtype('float64')

可以用字符码规定单精度浮点数,代码如下所示:

 In: dtype('f')
  Out: dtype('float32')

可以用字符码定义双精度浮点数,代码如下所示:

 In: dtype('d')
  Out: dtype('float64')

可以向dtype构造函数传递一个双字符码。其中,第一个字符表示数据类型,第二个字符是一个数字,表示该类型占用的字节数(数字2、4和8分别对应于16位、32位和64位浮点数):

 In: dtype('f8')
  Out: dtype('float64')

可以通过sctypeDict.keys()函数列出所有数据类型的字符码,代码如下所示。注意,由于输出内容过多,这里只截取了部分内容。

In: sctypeDict.keys()
Out: [0, …
 'i2',
 'int0']

2.4.4 dtype属性

类dtype提供了许多有用的属性,如可以通过dtype的属性获取某种数据类型对应的字符码(以下代码取自本书代码包中的dtypeattributes2.py文件):

In: t = dtype('Float64')
In: t.char
Out: 'd'

类型属性相当于数组元素对象的类型:

In: t.type
Out: <type 'numpy.float64'>

dtype的属性str中保存的是一个表示数据类型的字符串,其中第一个字符描述字节顺序,如果需要,后面会跟着字符码和数字,用来表示存储每个数组元素所需的字节数。这里,字节顺序(endianness)规定了32位或64位字内部各个字节的存储顺序。对于大端(big-endian)顺序,先存放权重最高的字节,用符号>指出。当使用小端(little-endian)顺序时,先存放权重最低的字节,用符号<指出。下面以代码为例进行说明:

In: t.str
Out: '<f8'
相关文章
|
6月前
|
存储 Java 数据处理
(numpy)Python做数据处理必备框架!(一):认识numpy;从概念层面开始学习ndarray数组:形状、数组转置、数值范围、矩阵...
Numpy是什么? numpy是Python中科学计算的基础包。 它是一个Python库,提供多维数组对象、各种派生对象(例如掩码数组和矩阵)以及用于对数组进行快速操作的各种方法,包括数学、逻辑、形状操作、排序、选择、I/0 、离散傅里叶变换、基本线性代数、基本统计运算、随机模拟等等。 Numpy能做什么? numpy的部分功能如下: ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组 用于对整组数据进行快速运算的标准数学函数(无需编写循环)。 用于读写磁盘数据的工具以及用于操作内存映射文件的工具。 线性代数、随机数生成以及傅里叶变换功能。 用于集成由C、C++
543 1
|
6月前
|
Java 数据处理 索引
(numpy)Python做数据处理必备框架!(二):ndarray切片的使用与运算;常见的ndarray函数:平方根、正余弦、自然对数、指数、幂等运算;统计函数:方差、均值、极差;比较函数...
ndarray切片 索引从0开始 索引/切片类型 描述/用法 基本索引 通过整数索引直接访问元素。 行/列切片 使用冒号:切片语法选择行或列的子集 连续切片 从起始索引到结束索引按步长切片 使用slice函数 通过slice(start,stop,strp)定义切片规则 布尔索引 通过布尔条件筛选满足条件的元素。支持逻辑运算符 &、|。
336 0
|
7月前
|
数据采集 数据可视化 数据挖掘
Python数据分析实战:Pandas处理结构化数据的核心技巧
在数据驱动时代,结构化数据是分析决策的基础。Python的Pandas库凭借其高效的数据结构和丰富的功能,成为处理结构化数据的利器。本文通过真实场景和代码示例,讲解Pandas的核心操作,包括数据加载、清洗、转换、分析与性能优化,帮助你从数据中提取有价值的洞察,提升数据处理效率。
365 3
|
9月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
1069 0
|
6月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
12月前
|
机器学习/深度学习 数据可视化 算法
Python数值方法在工程和科学问题解决中的应用
本文探讨了Python数值方法在工程和科学领域的广泛应用。首先介绍了数值计算的基本概念及Python的优势,如易学易用、丰富的库支持和跨平台性。接着分析了Python在有限元分析、信号处理、优化问题求解和控制系统设计等工程问题中的应用,以及在数据分析、机器学习、模拟建模和深度学习等科学问题中的实践。通过具体案例,展示了Python解决实际问题的能力,最后总结展望了Python在未来工程和科学研究中的发展潜力。
355 0
|
7月前
|
数据可视化 数据挖掘 大数据
基于python大数据的水文数据分析可视化系统
本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。
|
8月前
|
存储 数据挖掘 大数据
基于python大数据的用户行为数据分析系统
本系统基于Python大数据技术,深入研究用户行为数据分析,结合Pandas、NumPy等工具提升数据处理效率,利用B/S架构与MySQL数据库实现高效存储与访问。研究涵盖技术背景、学术与商业意义、国内外研究现状及PyCharm、Python语言等关键技术,助力企业精准营销与产品优化,具有广泛的应用前景与社会价值。
|
8月前
|
机器学习/深度学习 API 异构计算
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
JAX是Google开发的高性能数值计算库,旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API,还引入了自动微分、GPU/TPU加速和即时编译(JIT)等关键功能,显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景,为Python在高性能计算领域开辟了新路径。
792 0
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
|
8月前
|
存储 数据采集 数据处理
Pandas与NumPy:Python数据处理的双剑合璧
Pandas与NumPy是Python数据科学的核心工具。NumPy以高效的多维数组支持数值计算,适用于大规模矩阵运算;Pandas则提供灵活的DataFrame结构,擅长处理表格型数据与缺失值。二者在性能与功能上各具优势,协同构建现代数据分析的技术基石。
649 0

热门文章

最新文章

推荐镜像

更多
下一篇
开通oss服务