总结|学习笔记

简介: 快速学习 总结

开发者学堂课程【Python 数据分析库 Pandas 快速入门:总结 】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/607/detail/8859


总结


内容介绍

一、缺失值处理

二、数据离散化

三、合并

四、交叉表与透视表

五、分组与聚合

 

l 缺失值处理

1. 缺失值是 NaN 类型:

判断是否存在 np.nan 缺失值→ pd.notnull(df).all() 或者pd.isnull(df).any()

两种思路:删除 df.dropna()  、   替换 sr.fillna(value,inplace=)

2. 缺失值是其他默认符号:

替换 df.replace(to_replace="?",value=np.nan)

按照处理 nan 的步骤

 

l 数据离散化

1) 分组:

自动分组 pd.qcut(data,bins)

自定义分组 pd.cut(data,bins)

2) 转换

pd.get_dummies(分好组的数据,predix=)

 

l 合并

按方向合并pd.concat((a,b),axis=)

按索引合并pd.merge(left,right,how="inner",on=[索引])

 

l 交叉表与透视表

pd.crosstab(value1,value2)

df.pivot_table([字段],index=)

 

l 分组与聚合

dataframe.groupby(by=).聚合函数()

sr.groupby(sr).聚合函数()

相关文章
|
算法 计算机视觉
OpenCV学习笔记--SIFT,SUFT
图像处理两大特征提取算法
108 0
|
前端开发 Java 网络架构
合法性检查|学习笔记
快速学习合法性检查
135 0
|
开发者
需要、欲望、需求 | 学习笔记
快速学习需要、欲望、需求。
138 0
需要、欲望、需求 | 学习笔记
|
存储 自然语言处理 算法
课程计划|学习笔记
快速学习课程计划
71 0
|
消息中间件 Dubbo 算法
总结|学习笔记
快速学习总结
67 0
总结|学习笔记
|
安全 Java 程序员
Potainer 使用|学习笔记
快速学习 Potainer 使用
145 0
Potainer 使用|学习笔记
|
开发者
SearchType 详解|学习笔记
快速学习 SearchType 详解。
162 0
|
前端开发 开发工具 开发者
介绍|学习笔记
快速学习介绍
70 0
|
开发者
SearchType 详解 | 学习笔记
快速学习 SearchType 详解
92 0
|
弹性计算 缓存 Linux
使用 syncthing | 学习笔记
快速学习使用 syncthing,介绍了使用 syncthing 系统机制, 以及在实际应用过程中如何使用。
317 0
使用 syncthing | 学习笔记