备案控制台

开发者社区大数据文章正文

np.nan == np.nan问题

2022-06-16 118

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 今天在学习动手学数据分析的课程的时候，细心的队友发现了一个问题。对于数值型数据，pandas使用浮点值NAN（Not a Number）来表示缺失值，我们称NaN为容易检测到的标识值但是在运行以下代码时候，会发现...

np.nan == np.nan问题

今天在学习动手学数据分析的课程的时候，细心的队友发现了一个问题。

对于数值型数据，pandas使用浮点值NAN（Not a Number）来表示缺失值，我们称NaN为容易检测到的标识值

但是在运行以下代码时候，会发现：

np.nan == np.nan

返回的却是：

False

有点百思不得其解。然后继续查阅官方代码仓库的issue，定位到：

BUG: Incorrect handling of not-equal comparison to nan · Issue #21685 · numpy/numpy (github.com)

涉及的链接还有：

floating point - What is the rationale for all comparisons returning false for IEEE754 NaN values? - Stack Overflow

simd - How to choose AVX compare predicate variants - Stack Overflow

得知：

np.nan和任何数做不等于比较都返回True

np.nan != np.nan
np.nan != 0
np.nan != None
np.nan != 0.0

True
True
True
True

原因是这个底层代码使用了有序比较或者无序比较:

使用有序比较时：

For _CMP_NEQ_OQ (Ordered comparisons returns false for NaN operands):

nan != nan --> false
nan != 0 --> false

使用无序比较时：

For _CMP_NEQ_UQ (Unordered comparison returns true for NaN operands):

nan != nan --> true
nan != 0 --> true

总之，别用np.nan做任何比较，大于，小于，等于都不行。

判断是否是NaN，可以参考使用：

np.isnan(np.nan)

np.isnanAPI文档：

numpy.isnan — NumPy v1.22 Manual

文章标签：

Python

数据挖掘

沧夜2021

目录

相关文章

zzy的aly

|

2月前

|

索引 Python

Numpy学习笔记(三)：np.where和np.logical_and/or/not详解

NumPy库中`np.where`和逻辑运算函数`np.logical_and`、`np.logical_or`、`np.logical_not`的使用方法和示例。

zzy的aly

190 1 1

Numpy学习笔记(三)：np.where和np.logical_and/or/not详解

算精通

|

7月前

|

存储数据挖掘数据格式

np.fromfile“【5月更文挑战第22天】”

算精通

605 3 3

zzy的aly

|

2月前

|

Python

Numpy学习笔记(五)：np.concatenate函数和np.append函数用于数组拼接

NumPy库中的`np.concatenate`和`np.append`函数，它们分别用于沿指定轴拼接多个数组以及在指定轴上追加数组元素。

zzy的aly

54 0 0

Numpy学习笔记(五)：np.concatenate函数和np.append函数用于数组拼接

zzy的aly

|

2月前

|

机器学习/深度学习索引 Python

Numpy学习笔记(二):argmax参数中axis=0,axis=1,axis=-1详解附代码

本文解释了NumPy中`argmax`函数的`axis`参数在不同维度数组中的应用，并通过代码示例展示了如何使用`axis=0`、`axis=1`和`axis=-1`来找到数组中最大值的索引。

zzy的aly

175 0 0

Numpy学习笔记(二):argmax参数中axis=0,axis=1,axis=-1详解附代码

算精通

|

7月前

|

计算机视觉 Python

np.ones

算精通

162 1 1

一个处女座的程序猿

成功解决ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

成功解决ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

一个处女座的程序猿

3246 0 0

羊羊羊i

|

7月前

np.where()使用详解

1.函数介绍 np.where函数相当于三元表达式的向量版本，能够针对向量作三元操作，有两种使用方法。 np.where(condition, x, y)：当满足第一个参数条件时，where返回x，不满足第一个参数的条件时返回y。

羊羊羊i

198 0 0

greework

|

Python

【Numpy】深入剖析Numpy.arange()与range()的区别

【Numpy】深入剖析Numpy.arange()与range()的区别

greework

169 0 0

greework

|

Python

深入理解Numpy中sum求和的axis参数

深入理解Numpy中sum求和的axis参数

greework

164 0 0

吃果冻不吐果冻皮

|

算法定位技术

浅谈P、NP、NP-Complate和NP-Hard问题

时间复杂度时间复杂度并不是表示一个程序解决问题需要花多少时间，而是当程序所处理的问题规模扩大后，程序需要的时间长度对应增长得有多快。也就是说，对于某一个程序，其处理某一个特定数据的效率不能衡量该程序的好坏，而应该看当这个数据的规模变大到数百倍后，程序运行时间是否还是一样，或者也跟着慢了数百倍，或者变慢了数万倍。不管数据有多大，程序处理所花的时间始终是那么多的，我们就说这个程序很好，具O(1)O(1)O(1)的时间复杂度，也称常数级复杂度；

吃果冻不吐果冻皮

706 0 1

热门文章

最新文章

《Stata统计分析与应用（第2版）》一3.4 图形的保存、合并及修改

Maven 3.6.3 的下载、安装、配置、检测（详细讲解）

基于区块链的机器学习模型创建方案

WPF listview item mouse enter/over popup

DevExpress 10.2.4系列-ASPxListBox根据列值不同设置不同图标

[Spring]支持注解的Spring调度器

红帽7.4新增的安全特性

hdu 1800 Flying to the Mars

研究 flex 4 开发后台管理项目（1）

Error: XML response that was returned...

《docker高级篇（大厂进阶）：2.DockerFile解析》包括：是什么、DockerFile构建过程解析、DockerFile常用保留字指令、案例、小总结

《Java 人工智能开发：Eclipse 与 IntelliJ IDEA 双雄助力》

《Java 在开源 AI 框架中的中流砥柱角色》

《Java 与大数据框架：AI 数据预处理的强力联盟》

《Java 优化秘籍：计算密集型 AI 任务加速指南》

《Java 与 OpenAI 协同：开启智能编程新范式》

uniapp开发鸿蒙，是前端新出路吗？

鸿蒙(HarmonyOS)原生AI能力之文本识别

鸿蒙开发之PixelMap介绍与实现图片变换

鸿蒙(HarmonyOS)开发之无须申请权限写入图片到相册

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

【案例实战】SpringBoot整合阿里云文件上传OSS