Pandas | value_counts() 的详细用法

简介: Pandas | value_counts() 的详细用法

value_counts() 函数得作用


用来统计数据表中,指定列里有多少个不同的数据值,并计算每个不同值有在该列中的个数,同时还能根据指定得参数返回排序后结果。

返回得是Series对象


value_counts(values,sort=True, ascending=False, normalize=False,bins=None,dropna=True)


sort=True: 是否要进行排序;默认进行排序

ascending=False: 默认降序排列;

normalize=False: 是否要对计算结果进行标准化并显示标准化后的结果,默认是False。

bins=None: 可以自定义分组区间,默认是否

dropna=True:是否删除缺失值nan,默认删除


数据集

e17dc597cbcf46b88b9ab8aa61838070.png

要求:统计不同lable出现得次数


任何参数都不带


train_df['label'].value_counts()


默认统计个数并降序返回



ascending=True

87ca0894fd4e4fe8a70dade9c68a8340.png


normalize=True

数据标准化:在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。

数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。


train_df['label'].value_counts(ascending=False,normalize=True) 


数据标准化以后,所有得项得和为1(可能因为计算机存储数据而有误差)

常用来计算各数据占的比例


17061acd5978487486f7528dd2e32a91.png


bins分组统计

对于数值型的可以进行分组,分组以后返回结果


415e5f03b8054c748a90e5d81907ca9c.png

几种使用方式


  • 先取出列(Series对象),然后调用函数这时候相当于


train_df['label'].value_counts()


  • DataFrame
    对每一列都进行统计


train_df.apply(pd.value_counts)


  • 直接使用Pandas调用


pd.value_counts(train_df['label'],ascending=True)


同样的统计还可以使用 groupby,这个的过程是先按‘label’分组然后再统计每组的值,这样的效率较低,不建议使用


train_df.groupby('label').count()
相关文章
|
6月前
|
数据处理 索引 Python
Pandas中concat的用法
Pandas中concat的用法
188 1
|
6月前
|
存储 数据采集 数据处理
深入探索Pandas的DataFrame:基本用法与案例研究
深入探索Pandas的DataFrame:基本用法与案例研究
153 0
|
数据处理 Python
Pandas数据处理 | apply() 函数用法指南!
本文介绍一下关于 Pandas 中 apply() 函数的几个常见用法,apply() 函数的自由度较高,可以直接对 Series 或者 DataFrame 中元素进行逐元素遍历操作,方便且高效,具有类似于 Numpy 的特性。
|
2月前
|
数据采集 运维 数据挖掘
Pandas中的Rank用法:数据排序的高效工具
Pandas中的Rank用法:数据排序的高效工具
99 0
|
2月前
|
索引 Python
Pandas中的时间序列利器:set_index用法
Pandas中的时间序列利器:set_index用法
61 0
|
4月前
|
数据采集 数据挖掘 数据格式
Pandas的用法
【7月更文挑战第9天】Pandas的用法
27 3
|
3月前
|
索引 Python
【Pandas】Pandas Dataframe 常用用法
Pandas DataFrame的常用操作示例,包括筛选数据、索引操作、合并DataFrame、设置和排序索引、文本处理、列重命名、处理缺失值、排序以及删除满足特定条件的行等技巧。
63 0
|
6月前
|
索引 Python
pandas读取某列、某行数据——loc、iloc用法总结
pandas读取某列、某行数据——loc、iloc用法总结
659 2
|
数据可视化 数据挖掘 数据处理
【100天精通Python】Day58:Python 数据分析_Pandas时间序列数据处理,创建和解析时间数据pd.to_datetime(),.loc[],resample() 用法示例
【100天精通Python】Day58:Python 数据分析_Pandas时间序列数据处理,创建和解析时间数据pd.to_datetime(),.loc[],resample() 用法示例
542 0
|
机器学习/深度学习 人工智能 自然语言处理
高手系列!数据科学家私藏pandas高阶用法大全 ⛵
本文汇总介绍了21个 Pandas 进阶用法,能保持代码整洁优雅,更能提高代码效率!这篇是从数据科学家朋友那里搞到的私藏,快一起薅羊毛~
1242 4
高手系列!数据科学家私藏pandas高阶用法大全 ⛵