Python:我居然是渣男!万万没想到“渣男”语录排名第一的竟然是这一句!

简介: Python:我居然是渣男!万万没想到“渣男”语录排名第一的竟然是这一句!

大家好,我是欧K。

最近朋友提供了一份“渣男”语录,本期我们将使用pandas和wordcloud进行相关的分析,看看“渣男”最经常说的话都有哪些,小伙伴们请自觉对号入座


1. 数据加载

用pandas进行读取,我们看一下表格数据结构,输出前10行表格一共有三个字段:语录、喜欢、不喜欢

然后我们用df.shape看一下这份表格一共有多少条语录:

表格一共是974行3列,也就是一共有974条语录。


2. 数据处理

2.1 数据查重在我们做数据分析时,我们所要处理的数据中难免会出现重复的数据,接下来我们检查一下这份语录看看有没有重复的数据,这里介绍两种查重的方法:

  • unique() 以数组形式返回列的所有唯一值

  • nunique() 返回的是唯一值的个数

我们看到一共有719条有效数据(不重复数据)。

2.2 数据去重

drop_duplicates()

函数体:主要参数:subset输入要进行去重的列名,默认为None

keep:取值有三个,分别是 first、last、false。

  • keep=first时,保留相同数据的第一条。
  • keep=last时,保存相同数据的最后一条。
  • keep=false时,所有相同的数据都不保留。

inplace:布尔值,默认为False,是否直接在原数据上删除重复项或删除重复项后返回副本。

去重后一共有719条数据。


2.2 排序

按喜欢数量进行排序:

多喝热水!

多喝热水!

多喝热水!

对,你没看错,榜单第一是:多喝热水!

我居然是渣男!我裂了呀


合不上的那种!

有多少小伙伴中枪了,请自觉排队。。。

筛选喜欢数量大于90的数据:


3. 词云制作

我们看看语录中出现的词汇都有哪些:

结果:

完。


END

以上就是本期为大家整理的全部内容了,有需要语录的小伙伴可以在后台回复“渣男语录”,即可获取,喜欢的朋友可以点赞、点在看也可以分享到朋友圈让更多人知道哦

相关文章
|
6月前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
88 2
|
6月前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名?
Pandas在Python中提供数据排序和排名功能。使用`sort_values()`进行排序,如`df.sort_values(by='A', ascending=False)`进行降序排序;用`rank()`进行排名,如`df['A'].rank(ascending=False)`进行降序排名。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`。
158 6
|
6月前
|
数据可视化 数据处理 索引
Python如何对数据进行排序和排名操作?
Python如何对数据进行排序和排名操作?
121 0
|
6月前
|
数据采集 搜索推荐 数据处理
搜索引擎优化:利用Python爬虫实现排名提升
搜索引擎优化:利用Python爬虫实现排名提升
|
Web App开发 iOS开发 Python
python之爬取某瓣前250排名电影标题
初学者练练手洒洒水
94 0
|
存储 缓存 JavaScript
Python 最近两条好消息:①TIOBE排名超过C和Java②新版本发布3.10.0,还有今天刚发布的《What’s New in Python(2021.10.15)》
Python 最近两条好消息:①TIOBE排名超过C和Java②新版本发布3.10.0,还有今天刚发布的《What’s New in Python(2021.10.15)》
77 0
|
算法 Python
一日一技:Python实现有序列表并列排名
一日一技:Python实现有序列表并列排名
164 0
|
数据可视化 数据挖掘 Python
COVID-19数据分析实战:用Python绘制动态排名视频
COVID-19数据分析实战:用Python绘制动态排名视频
COVID-19数据分析实战:用Python绘制动态排名视频
|
数据采集 Python
python编程-24:实例1-中国大学排名爬虫
python编程-24:实例1-中国大学排名爬虫
197 0
python编程-24:实例1-中国大学排名爬虫
|
SQL 关系型数据库 数据库
Python爬虫——爬取中国高校排名前100名并写入MySQL
  本篇分享讲爬取中国高校排名前100名并将其写入MySQL,这样做的好处是:1.将数据存入数据库,能永久利用;2.能利用数据库技术做一些其他操作。
1606 0