Pandas 缺失数据
目录:
一. 处理缺失数据
二. 滤除缺失数据
三. 填充缺失数据
一. 处理缺失数据
二. 滤除缺失数据
dropna()
1. Series:dropna 返回一个仅含非空数据和索引值的 Series
2. DataFrame:
行:dropna默认丢弃任何含有缺失值的行,传入 how = 'all' 将值丢弃权威 NA 的那些行。
列:传入 axis = 1,如 data.dropna(axis = 1, how = 'all')
三. 填充缺失数据
fillna()
1. df.fillna(0),用 0 填充空值
2. 通过字典调用 fillna,可以实现对不同的列填充不同的值:
df.fillna({1:0.5, 3:-1})
3. fillna 默认会返回新对象,但也可以对现有对象进行就地修改:
_ = df.fillna(0, inplace = True)
以上整理自《利用Python进行数据分析》。