pandas 某一列不重复的值有多少

简介: 以o2o大赛的数据为例 df_new = df[['User_id','Merchant_id']] df_new_1 = df_new.groupby(['User_id'])['Merchant_id'].



以o2o大赛的数据为例

df_new = df[['User_id','Merchant_id']]


df_new_1 = df_new.groupby(['User_id'])['Merchant_id'].nunique()


 


在同一个'User_id'下,'Merchant_id'有多少个


df_new_1 = df_new.groupby(['User_id'])['Merchant_id'].value_counts()


 

Name: Merchant_id, dtype: int64


df_new_1 = df_new.groupby(['User_id'])['Merchant_id'].unique()

返回具体的unique值

 



Series.nunique(dropna=True)[source]

Parameters:

dropna : boolean, default True

Don’t include NaN in the count.

Returns:
nunique : int

Return number of unique elements in the object.

Excludes NA values by default




源码
def nunique ( self , dropna = True ):
"""
Return number of unique elements in the object.
Excludes NA values by default.
Parameters
----------
dropna : boolean, default True
Don't include NaN in the count.

Returns
-------
nunique : int
"""
uniqs = self .unique()
n = len (uniqs)
if dropna and isna(uniqs).any():
n -= 1
return n

.

目录
相关文章
|
12天前
|
Python
使用 Pandas 库时,如何处理数据的重复值?
在使用Pandas处理数据重复值时,需要根据具体的数据特点和分析需求,选择合适的方法来确保数据的准确性和唯一性。
59 8
|
20天前
|
Python
Pandas 常用函数-数据合并
Pandas 常用函数-数据合并
32 1
|
3月前
|
数据处理 Python
Pandas快速统计重复值的2种方法
Pandas快速统计重复值的2种方法
125 1
|
7月前
|
数据采集 数据处理 索引
如何使用 Pandas 删除 DataFrame 中的非数字类型数据?
如何使用 Pandas 删除 DataFrame 中的非数字类型数据?
92 3
|
7月前
|
数据处理 Python
使用Pandas解决问题:对比两列数据取最大值的五种方法
​在数据处理和分析中,经常需要比较两个或多个列的值,并取其中的最大值。Pandas库作为Python中数据处理和分析的强大工具,提供了多种灵活的方法来实现这一需求。本文将详细介绍五种使用Pandas对比两列数据并取最大值的方法,通过代码示例和案例分析,帮助新手更好地理解并掌握这些技巧。
159 0
|
7月前
|
SQL 人工智能 数据处理
Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)
Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)
146 0
|
Python
【一日一技】超简单的Pandas数据筛选方法
【一日一技】超简单的Pandas数据筛选方法
138 0
|
开发者 索引 Python
pandas 数据合并与整形 4|学习笔记
快速学习 pandas 数据合并与整形 4