文档备案控制台

开发者社区开发与运维文章正文

建模常用的pandas语句

2018-11-21 9152

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： pandas对象是Python常用的数据分析模块，它主要包括series对象，dataframe对象和index对象。每种对象都有自己所特有的方法和属性。今天小编更新下建模中常用的pandas语句

　　pandas对象是Python常用的数据分析模块，它主要包括series对象，dataframe对象和index对象。每种对象都有自己所特有的方法和属性。今天小编更新下建模中常用的pandas语句。

　　额外提一句哈。小编不私聊哈，有事的话请加qq群的，微信群已满。

　　1.导入pandas和numpy模块

　　import pandas as pd

　　import numpy as np

　　import os

　　2.查看并更改工作路径

　　pwd

　　os.chdir('更改的路径')

　　3.读入数据集

　　df=pd.read_csv(r'文件路径')

　　4.查看列数、行数

　　print(df1.columns.size,df.iloc[:,0].size)

　　5.查看列名

　　df.columns.tolist()

　　6.查看每个特征的类型

　　for col in fk_df.columns:print(col,fk_df[col].dtype)

　　7.计算坏账率

　　badRate=df['target'].sum()/df['target'].count()

　　8.计算特征空值率

　　null_rate=1-df.count()/df.shape[0]

　　9.保留空值率小于0.2的特征

　　cols=null_rate[null_rate<0.2].index.tolist()

　　10.查找数据集数值中型特征小于0的值并置为nan

　　def rep(x):if type(x)!=str and x<0:print(x)return np.nan return x df=df.applymap(rep)

　　11.设置新的索引

　　df=df.reindex()

　　12.检查常量特征

　　df1=df.loc[:,df1.apply(pd.Series.nunique)!=1]

　　13.查看是否有重复特征

　　len(set(list(df1.columns)))==df1.shape[1]

　　14.查看特征类别数

　　df1['education'].value_counts()

文章标签：

Python

索引

关键词：

Pandas语句

乌克兰老刘

目录

相关文章

Deephub

|

SQL Python

Pandas与SQL的数据操作语句对照

Pandas与SQL的数据操作语句对照

Deephub

444 0 1

Pandas与SQL的数据操作语句对照

凉凉心.

|

9月前

|

Java 数据处理索引

（Pandas）Python做数据处理必选框架之一！（二）：附带案例分析；刨析DataFrame结构和其属性；学会访问具体元素；判断元素是否存在；元素求和、求标准值、方差、去重、删除、排序...

DataFrame结构每一列都属于Series类型，不同列之间数据类型可以不一样，但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列，该列记录了每一行的索引在DataFrame中，若列之间的元素个数不匹配，且使用Series填充时，在DataFrame里空值会显示为NaN；当列之间元素个数不匹配，并且不使用Series填充，会报错。在指定了index 属性显示情况下，会按照index的位置进行排序，默认是 [0,1,2,3,...] 从0索引开始正序排序行。

凉凉心.

661 0 1

凉凉心.

|

9月前

|

Java 数据挖掘数据处理

（Pandas）Python做数据处理必选框架之一！（一）：介绍Pandas中的两个数据结构；刨析Series：如何访问数据；数据去重、取众数、总和、标准差、方差、平均值等；判断缺失值、获取索引...

Pandas 是一个开源的数据分析和数据处理库，它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具，特别适用于处理结构化数据，如表格型数据（类似于Excel表格）。 Pandas 是数据科学和分析领域中常用的工具之一，它使得用户能够轻松地从各种数据源中导入数据，并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构：Series 和 DataFrame。

凉凉心.

738 0 0

gudanhero2018

|

机器学习/深度学习数据处理 Python

从NumPy到Pandas：轻松转换Python数值库与数据处理利器

从NumPy到Pandas：轻松转换Python数值库与数据处理利器

gudanhero2018

475 1 1

站大爷

|

11月前

|

存储数据采集数据处理

Pandas与NumPy：Python数据处理的双剑合璧

Pandas与NumPy是Python数据科学的核心工具。NumPy以高效的多维数组支持数值计算，适用于大规模矩阵运算；Pandas则提供灵活的DataFrame结构，擅长处理表格型数据与缺失值。二者在性能与功能上各具优势，协同构建现代数据分析的技术基石。

站大爷

823 0 0

土木林森

|

数据采集存储数据挖掘

Python数据分析：Pandas库的高效数据处理技巧

【10月更文挑战第27天】在数据分析领域，Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧，帮助数据分析师快速处理复杂数据集，提高工作效率。

土木林森

473 0 0

土木林森

|

存储数据挖掘数据处理

Python数据分析：Pandas库的高效数据处理技巧

【10月更文挑战第26天】Python 是数据分析领域的热门语言，Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧，并通过示例代码展示其实际应用。

土木林森

441 2 2

半截诗

|

机器学习/深度学习并行计算大数据

【Python篇】深入挖掘 Pandas：机器学习数据处理的高级技巧

【Python篇】深入挖掘 Pandas：机器学习数据处理的高级技巧

半截诗

688 3 3

龙大吉

|

数据采集数据挖掘 API

Python数据分析加速器：深度挖掘Pandas与NumPy的高级功能

在Python数据分析的世界里，Pandas和NumPy无疑是两颗璀璨的明星，它们为数据科学家和工程师提供了强大而灵活的工具集，用于处理、分析和探索数据。今天，我们将一起深入探索这两个库的高级功能，看看它们如何成为数据分析的加速器。

龙大吉

275 1 1

小白学大数据

|

机器学习/深度学习数据采集监控

Pandas与Matplotlib：Python中的动态数据可视化

Pandas与Matplotlib：Python中的动态数据可视化

小白学大数据

449 2 3

热门文章

最新文章

pandas.to_numeric转化数据为数字型

20年IT老兵分享：账务系统设计及应用

Apache Flink 漫谈系列(08) - SQL概览

nvm安装教程与nvm常见命令，超详细！

nfs client高性能参数设置

《树莓派Python编程入门与实战》——2.3　使用Raspbian图形用户界面

AntV 图可视分析解决方案，来啦！

Pandas获取SQL数据库read_sql()函数及参数一文详解+实例代码

使用Pandas从Excel文件中提取满足条件的数据并生成新的文件

Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)

（Pandas）Python做数据处理必选框架之一！（二）：附带案例分析；刨析DataFrame结构和其属性；学会访问具体元素；判断元素是否存在；元素求和、求标准值、方差、去重、删除、排序...

（Pandas）Python做数据处理必选框架之一！（一）：介绍Pandas中的两个数据结构；刨析Series：如何访问数据；数据去重、取众数、总和、标准差、方差、平均值等；判断缺失值、获取索引...

Pandas与NumPy：Python数据处理的双剑合璧

告别低效代码：用对这10个Pandas方法让数据分析效率翻倍

Pandas时间数据处理：从基础到进阶的实战指南

Pandas时间数据处理：从基础到进阶的实战指南

Pandas数据合并：10种高效连接技巧与常见问题

Pandas高级数据处理：数据仪表板制作

Pandas高级数据处理：数据报告生成

Pandas高级数据处理：交互式数据探索

相关课程

更多

Python 数据分析库 Pandas 快速入门

相关电子书

更多

中文：即学即用的Pandas入门与时间序列分析

即学即用的Pandas入门与时间序列分析

低代码开发师（初级）实战教程

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！