利用Python网络爬虫抓取微信好友的签名及其可视化展示

简介: 前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化,利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所在省位和城市分布及其可视化,感兴趣的小伙伴可以点击进去看看详情,内容方面不是很难,即使你是小白,也可以通过代码进行实现抓取。

前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所在省位和城市分布及其可视化,感兴趣的小伙伴可以点击进去看看详情,内容方面不是很难,即使你是小白,也可以通过代码进行实现抓取。今天,小编继续给大家分享如何利用Python网络爬虫抓取微信好友的签名及其可视化展示,具体的教程如下所示。

1、代码实现还是基于itchat库,关于这个神奇的库,在之前的文章中有提及, 再次不多赘述。下图的代码的功能是实现签名的抓取和数据提取。之后将抓取到的数据写入到本地文件中去。

img_be047506a798d648727d560f0c1cd6ac.jpe

2、程序运行完成之后,得到了一个文本文件,内容如下图所示。

img_dd3495f6923327c25511384f949551bc.jpe

第一行中最开始的那条签名是小编自己的,博学,审问,慎思,明辨,笃行。之后的签名是根据微信通讯录上的名片列序来进行呈现的。如果好友有微信签名的话,都会抓取下来,如果没有签名的话,则忽略。

3、随机的验证一下微信好友的签名,再此以小编对象的微信签名为例,她的签名是“得之安然、失之坦然、处之泰然、顺其自然、争其必然!”,之后在TXT文件中进行搜索,可以看到其签名确实是存在里边的,如下图所示。

img_cd073b3acbd30f025983cfa7342c45b1.jpe

4、接下来就要对这个文件文件进行词云可视化呈现了。继续写代码,如下图所示。

img_dfddb5fbedc8de94cde31cec16f00bed.jpe

代码的关键部分是需要底图和字体,底图小编用的是路飞,注意要使用白色底图的图片,不然词云可视化的时候效果不佳。

img_267f549ffcc88b3ac6536b4f2816f87b.jpe

字体的话需要自己提前去下载,对于可视化呈现也可以参考这篇文章:如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化

5、运行程序之后,仍然需要进行扫码授权,程序运行如下图所示。

img_a4b33e340521a871986bbcf713b15ddc.jpe

红色代码部分,上一篇文章已经详细讲解过了,再次不多赘述了。

6、之后我们可以看到漂亮的词云图就展示在我们面前了,如下图所示。

img_c844d4327bc04809cc94c9a37df874c6.jpe

根据词云的可视化效果来看,关键词:人生、努力、时间、我们、哈哈哈……等词语,出现的频率较高。可以感受得到小编的微信好友的签名基本上都突显出积极乐观,珍惜时间,努力奋斗的特征。

劝君吸取金缕衣,劝君惜取少年时。花开堪折直须折,莫待无花空折枝。祝福大家周末愉快,人生苦短,我用Python~~

相关文章
|
2月前
|
机器学习/深度学习 数据可视化 计算机视觉
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
这篇文章详细介绍了如何通过可视化深度学习中每层特征层来理解网络的内部运作,并使用ResNet系列网络作为例子,展示了如何在训练过程中加入代码来绘制和保存特征图。
63 1
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
|
2月前
|
机器学习/深度学习 数据可视化 Windows
深度学习笔记(七):如何用Mxnet来将神经网络可视化
这篇文章介绍了如何使用Mxnet框架来实现神经网络的可视化,包括环境依赖的安装、具体的代码实现以及运行结果的展示。
54 0
|
15天前
|
数据采集 前端开发 JavaScript
除了网页标题,还能用爬虫抓取哪些信息?
爬虫技术可以抓取网页上的各种信息,包括文本、图片、视频、链接、结构化数据、用户信息、价格和库存、导航菜单、CSS和JavaScript、元数据、社交媒体信息、地图和位置信息、广告信息、日历和事件信息、评论和评分、API数据等。通过Python和BeautifulSoup等工具,可以轻松实现数据抓取。但在使用爬虫时,需遵守相关法律法规,尊重网站的版权和隐私政策,合理控制请求频率,确保数据的合法性和有效性。
|
2月前
|
数据采集 Python
python爬虫抓取91处理网
本人是个爬虫小萌新,看了网上教程学着做爬虫爬取91处理网www.91chuli.com,如果有什么问题请大佬们反馈,谢谢。
28 4
|
3月前
|
数据采集 存储 监控
网络爬虫的最佳实践:结合 set_time_limit() 与 setTrafficLimit() 抓取云盘数据
本文探讨了如何利用 PHP 的 `set_time_limit()` 与爬虫工具的 `setTrafficLimit()` 方法,结合多线程和代理 IP 技术,高效稳定地抓取百度云盘的公开资源。通过设置脚本执行时间和流量限制,使用多线程提高抓取效率,并通过代理 IP 防止 IP 封禁,确保长时间稳定运行。文章还提供了示例代码,展示了如何具体实现这一过程,并加入了数据分类统计功能以监控抓取效果。
70 16
网络爬虫的最佳实践:结合 set_time_limit() 与 setTrafficLimit() 抓取云盘数据
|
2月前
|
数据采集 Web App开发 JavaScript
Selenium爬虫技术:如何模拟鼠标悬停抓取动态内容
本文介绍了如何使用Selenium爬虫技术抓取抖音评论,通过模拟鼠标悬停操作和结合代理IP、Cookie及User-Agent设置,有效应对动态内容加载和反爬机制。代码示例展示了具体实现步骤,帮助读者掌握这一实用技能。
Selenium爬虫技术:如何模拟鼠标悬停抓取动态内容
|
2月前
|
移动开发 小程序 数据可视化
一招学会DIY官网可视化设计支持导出微擎、UNIAPP、H5、微信小程序源码
一招学会DIY官网可视化设计支持导出微擎、UNIAPP、H5、微信小程序源码
43 2
|
3月前
|
数据采集 存储 JavaScript
构建您的第一个Python网络爬虫:抓取、解析与存储数据
【9月更文挑战第24天】在数字时代,数据是新的金矿。本文将引导您使用Python编写一个简单的网络爬虫,从互联网上自动抓取信息。我们将介绍如何使用requests库获取网页内容,BeautifulSoup进行HTML解析,以及如何将数据存储到文件或数据库中。无论您是数据分析师、研究人员还是对编程感兴趣的新手,这篇文章都将为您提供一个实用的入门指南。拿起键盘,让我们开始挖掘互联网的宝藏吧!
|
2月前
|
机器学习/深度学习 数据可视化 Linux
Seaborn可视化学习笔记(一):可视化神经网络权重分布情况
这篇文章是关于如何使用Seaborn库来可视化神经网络权重分布的教程,包括函数信息、测试代码和实际应用示例。
48 0
|
2月前
|
数据采集
爬虫案例—抓取找歌词网站的按歌词找歌名数据
爬虫案例—抓取找歌词网站的按歌词找歌名数据