处理np.nan类型的缺失值| 学习笔记

简介: 快速学习处理np.nan类型的缺失值

开发者学堂课程【Python 数据分析库 Pandas 快速入门处理np.nan类型的缺失值学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/607/detail/8860


处理np.nan类型的缺失值


如何处理 nan

1.判断数据是否为 NaN : pd.isnull(df),pd.notnull(df)

2.存在缺失值 nan,并且是 np.nan:

删除存在缺失值的:dropna(inplace = False)

-注:不会修改原数据,需要接受返回值。

替换缺失值:fillna(value,inplace=True)

value:替换成的值

inplace:

-True:会修改原数据

-False:不替换修改原数据,生成新的对象

3.不是缺失值 nan,有默认标记的


处理缺失值实例  

第一步:判断是否存在 nan 类型的缺失值

In:

import pandas as pd

movie = pd.read_csv ( " ./IMDB/IMDB-Movie-Data.csv " )

movie.head( )    

Out:

In:

pd .isnul1(movie)

Out:

  //这两种方法中间有省略部分,很难看到缺失值

In:

import numpy as np

np.any ( pd.isnull (movie) )  

Out:

True   //返回 True,说明数据中存在缺失值

In:

np.all ( pd.notnul1 (movie) )  

Out:

False   //返回 False,说明数据中存在缺失值

In:

pd.isnull ( movie ).any ( )Rank

Out:

Title

False

Genre

False

Description

False

Director

False

Actors

False

Year

False

Runtime ( Minutes )

False

Rating

False

Votes

False

Revenue (Millions )

True

Metascore

True

dtype: bool   //显示每一个字段是否存在缺失值

In:

pd.notnull ( movie).all()

Out:

Title

True

Genre

True

Description

True

Director

True

Actors

True

Year

True

Runtime ( Minutes )

True

Rating

True

Votes

True

Revenue (Millions )

False

Metascore

False

dtype: bool   //同上

第二步:缺失值处理

方法1∶删除含有缺失值的样本

In:

datal =movie.dropna ()

pd.notnull ( movie ).all()

Out:

Title

True

Genre

True

Description

True

Director

True

Actors

True

Year

True

Runtime ( Minutes )

True

Rating

True

Votes

True

Revenue (Millions )

False

Metascore

False

In:

pd.notnull ( movie ).all()

Out:

Title

True

Genre

True

Description

True

Director

True

Actors

True

Year

True

Runtime ( Minutes )

True

Rating

True

Votes

True

Revenue (Millions )

True

Metascore

True

方法2:替换

In:

//含有缺失值的字段

//Revenue (Millions )

//Metascore

movie["Revenue (Millions)"].fillna(movie["Revenue(Millions) " ].mean(), inplace=True)

movie["Metascore"].fillna(movie["Metascore"].mean( ), inplace=True)

In:

pd.notnull ( movie ).all( )   //缺失值已经处理完毕,不存在缺失值

Out:

Title

True

Genre

True

Description

True

Director

True

Actors

True

Year

True

Runtime ( Minutes )

True

Rating

True

Votes

True

Revenue (Millions )

True

Metascore

True

相关文章
|
5天前
|
人工智能 运维 安全
|
3天前
|
人工智能 异构计算
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
|
10天前
|
人工智能 JavaScript 测试技术
Qwen3-Coder入门教程|10分钟搞定安装配置
Qwen3-Coder 挑战赛简介:无论你是编程小白还是办公达人,都能通过本教程快速上手 Qwen-Code CLI,利用 AI 轻松实现代码编写、文档处理等任务。内容涵盖 API 配置、CLI 安装及多种实用案例,助你提升效率,体验智能编码的乐趣。
843 109
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
B站开源IndexTTS2,用极致表现力颠覆听觉体验
在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推动零样本语音合成在实际场景中的落地能力,B站语音团队对模型架构与训练策略进行了深度优化,推出了全新一代语音合成模型——IndexTTS2 。
466 12
|
4天前
|
人工智能 测试技术 API
智能体(AI Agent)搭建全攻略:从概念到实践的终极指南
在人工智能浪潮中,智能体(AI Agent)正成为变革性技术。它们具备自主决策、环境感知、任务执行等能力,广泛应用于日常任务与商业流程。本文详解智能体概念、架构及七步搭建指南,助你打造专属智能体,迎接智能自动化新时代。
|
4天前
|
机器学习/深度学习 传感器 算法
Edge Impulse:面向微型机器学习的MLOps平台——论文解读
Edge Impulse 是一个面向微型机器学习(TinyML)的云端MLOps平台,致力于解决嵌入式与边缘设备上机器学习开发的碎片化与异构性难题。它提供端到端工具链,涵盖数据采集、信号处理、模型训练、优化压缩及部署全流程,支持资源受限设备的高效AI实现。平台集成AutoML、量化压缩与跨硬件编译技术,显著提升开发效率与模型性能,广泛应用于物联网、可穿戴设备与边缘智能场景。
188 127