Pandas中实现词频统计次数,该怎么写?

简介: Pandas中实现词频统计次数,该怎么写?

大家好,我是皮皮。


一、前言


前几天在Python铂金交流群有个叫【dcpeng】的粉丝问了一个Pandas中实现词频统计次数的问题,这里拿出来给大家分享下,一起学习下。

image.png

下图是原始数据:

image.png

他自己写的部分代码,如下:

df = pd.read_excel('./data.xls', names=['name', 'count'])
names = ['明玉', '苏明玉',  '苏总', '朱丽', '丽丽', '明哲', '苏明哲', '大哥', '明成', '苏明成', '大哥',
         '苏大强', '老爹', '爸', '吴非', '苏家', '宝宝', '老蒙', '蒙总', '小蒙', '天冬', '石天冬',
         '石大哥', '柳青', '蔡根花', '钟点工', '温玮光', ' 温总', '苏母']


二、解决过程


这里【月神】给出了一个代码,如下图所示:

image.png

然后他自己修改下,就搞定了。

image.png

代码如下所示:

df = pd.read_excel('./data.xls')
names = ['明玉', '苏明玉',  '苏总', '朱丽', '丽丽', '明哲', '苏明哲', '大哥', '明成', '苏明成', '大哥',
         '苏大强', '老爹', '爸', '吴非', '苏家', '宝宝', '老蒙', '蒙总', '小蒙', '天冬', '石天冬',
         '石大哥', '柳青', '蔡根花', '钟点工', '温玮光', ' 温总', '苏母']
print(df[df['name'].isin(names)])

不过事情还没有完成,后来又提新的需求了。

image.png

比如这种,他都是一个人,怎么把他处理到一块?

image.png

这里他自己想到了一个可行的思路。把人名整理到每一行,以空格分开,每一行代表一个人,之后逐行读取,然后传值到变量里边,df[df['name'].isin(names)],挨个输出就可以了,代码如下:

with open('人名.txt', 'r', encoding='utf-8') as f:
    name_count = 0
    for names in f:
        name = names.strip().split()
        count = df[df['name'].isin(name)]
        # print(df[df['name'].isin(list(names))])  
        print(count['count'].sum())

image.png

之后就可以进一步做词云图啥的了,巴适得很!

image.png


三、总结


大家好,我是皮皮。这篇文章主要分享了Pandas中实现词频统计次数的问题,文中针对该问题给出了具体的解析和代码演示,帮助粉丝顺利解决了问题。


最后感谢粉丝【dcpeng】提问,感谢【月神】给出的具体解析和代码演示,感谢【杨羊】、【沈复】等人参与学习交流。


小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。


------------------- End -------------------

相关文章
|
3月前
|
数据处理 Python
Pandas快速统计重复值的2种方法
Pandas快速统计重复值的2种方法
183 1
|
数据采集 数据挖掘 索引
pandas数据分析之数据运算(逻辑运算、算术运算、统计运算、自定义运算)
数据分析离不开数据运算,在介绍完pandas的数据加载、排序和排名、数据清洗之后,本文通过实例来介绍pandas的常用数据运算,包括逻辑运算、算术运算、统计运算及自定义运算。
460 0
|
数据挖掘 索引 Python
【100天精通Python】Day57:Python 数据分析_Pandas数据描述性统计,分组聚合,数据透视表和相关性分析
【100天精通Python】Day57:Python 数据分析_Pandas数据描述性统计,分组聚合,数据透视表和相关性分析
151 0
|
数据挖掘 Go 索引
Python 使用pandas 进行查询和统计详解
Python 使用pandas 进行查询和统计详解
125 0
Python应用专题 | 7:pandas中列方向字符统计及其合并
主要介绍如何统计pandas中列方向字符及其合并
|
机器学习/深度学习 自然语言处理 Python
Python应用专题 | 6:基于pandas统计某一列字符串中各个word出现的频率
如果pandas中某一列是字符串,想要统计该列字符串分词结果后各词出现的词频。
|
数据挖掘 Python
Pandas 描述和汇总统计函数
Pandas 描述和汇总统计函数
Pandas 描述和汇总统计函数
|
人工智能 算法 数据可视化
Pandas-统计|学习笔记
快速学习 Pandas-统计
186 0
DS之信息挖掘:利用pandas库统计某一列col中各个值出现的次数(降序输出)
DS之信息挖掘:利用pandas库统计某一列col中各个值出现的次数(降序输出)
DS之信息挖掘:利用pandas库统计某一列col中各个值出现的次数(降序输出)
|
索引 Python