Pandas 常用函数-数据清洗

简介: Pandas 常用函数-数据清洗
函数 说明
df.dropna() 删除包含缺失值的行或列;
df.fillna(value) 将缺失值替换为指定的值;
df.replace(old_value, new_value) 将指定值替换为新值;
df.duplicated() 检查是否有重复的数据;
df.drop_duplicates() 删除重复的数据。

实例

# 删除包含缺失值的行或列

df.dropna()


# 将缺失值替换为指定的值

df.fillna(0)


# 将指定值替换为新值

df.replace('old_value', 'new_value')


# 检查是否有重复的数据

df.duplicated()


# 删除重复的数据

df.drop_duplicates()

目录
相关文章
|
3月前
|
数据采集 数据挖掘 数据处理
如何使用 Pandas 库进行数据清洗和预处理?
数据清洗和预处理是数据分析中至关重要的步骤,Pandas库提供了丰富的函数和方法来完成这些任务
175 64
|
2月前
|
数据采集 分布式计算 大数据
Pandas数据清洗:缺失值处理
本文详细介绍了Pandas库中处理缺失值的方法,包括检测缺失值、删除缺失值、填充缺失值和插值法填充缺失值。通过基础概念和代码示例,帮助读者理解和解决数据清洗中常见的缺失值问题。
167 80
|
3月前
|
Python
|
3月前
|
Python
|
3月前
|
Python
Pandas 常用函数-数据合并
Pandas 常用函数-数据合并
56 1
|
3月前
|
索引 Python
Pandas 常用函数-数据排序
10月更文挑战第28天
33 1
|
3月前
|
Python
Pandas 常用函数-查看数据
Pandas 常用函数-查看数据
37 2
|
3月前
|
SQL JSON 数据库
Pandas 常用函数-读取数据
Pandas 常用函数-读取数据
46 2
|
3月前
|
数据采集 数据挖掘 数据格式
Pandas 数据清洗
10月更文挑战第27天
74 0
Pandas 数据清洗
|
3月前
|
BI Python
Pandas 常用函数-数据统计和描述
Pandas 常用函数-数据统计和描述
133 0