看到自己的朋友圈,我和我的小伙伴都惊呆了

简介: 看到自己的朋友圈,我和我的小伙伴都惊呆了

我们每天日常都在做的事情不再只是吃饭喝水睡觉了,还多了一条--------刷朋友圈。经过某数据统计,我们生活中每人每天平均花在刷朋友圈的时间竟高达两个小时。这样的数据说明,其实朋友圈已经融入了我们的生活了,从2012年开始,到现在的六个年头,微信从一个普通的聊天工具变成了我们生活的一部分,好像真的是做到了不离不弃一样,那么,你知道你的微信朋友圈里都是怎样的一群人吗?

或许,你知道。因为你每天一直在刷朋友圈,所以你掌握了朋友圈的所有动向,而有的人就只会选择性的去看自己的朋友圈,对于一些曾经加过的人都不在关注了,小编在2014年的时候开始使用微信,当时就很着迷微信,经常和朋友们一起聊微信,发朋友圈。但是到现在,我已经很少去发朋友圈,看朋友圈了,现在的时间很紧,工作,代码,工作,代码(拿钱养家糊口),要不然就只能路边乞讨了

物以类聚,人以群分。每个人的社交圈,家庭圈,朋友圈的属性,基本我们人格的特征属性。我们所处的阶级,在别人眼中的印象,在我们的朋友圈中都会得到印证。

朋友圈数据中最具人格属性的因素是个性签名,那么下面我们就把所有好友的个性签名作为我们的研究对象,以此出发爬取数据。


今天我们就介绍一个工具,使用它来探索你的朋友圈,看看这些年你错的那些朋友圈的好友。


工具:itchat,jieba,wordcloud,PIL


pip install itchat
pip install wordcloud
pip install jieba
pip install pillow

我们先获取朋友圈所有人的签名,将这些签名都存到一个文件之中。


首先我们需要登录微信,这个时候直接调用login方法便可以直接登录微信了:


itchat.login()

之后便会自动生成一个二维码,扫一扫就可以登录了。


640.png

我们首先获取微信里的所有好友:


friends = itchat.get_friends(update=True)[0:]


获取好友是为了拿到他们的朋友圈签名信息:

我们使用for循环去遍历所有的好友,之后获取朋友圈签名,接下来使用正则表达式筛选纯净的签名内容。


tList = []
for i in friends:
    signature = i["Signature"].replace(" ", "").replace("span", "").replace("class", "").replace("emoji", "")
    rep = re.compile("1f\d.+")
    signature = rep.sub("", signature)
    tList.append(signature)
将获取的内容可以写到一个txt文件里:
strs = "".join(tList)
with open('record.txt','a',encoding='utf-8') as f:
    f.write(strs)


我们可以查看这个txt文件,这里面就是所有的朋友圈签名了:

640.jpg


现在我们已经获取了所有的朋友圈签名,下面我们可以使用jieba进行分词,统计词出现的频率,之后使用词云将统计后的效果展示出来。



使用结巴切词:


import jieba
wordlist_jieba = jieba.cut(text, cut_all=True)
wl_space_split = " ".join(wordlist_jieba)


之后将切完的词给wordcloud进行展示:


from wordcloud import WordCloud, ImageColorGenerator
import os
import numpy as np
import PIL.Image as Image
d= os.path.dirname(os.path.abspath( __file__ ))
alice_coloring = np.array(Image.open(os.path.join(d, r"3.jpg")))
my_wordcloud = WordCloud(background_color="white",
                         max_words=2000,
                         mask=alice_coloring,
                         max_font_size=400,
                         random_state=420,
                         font_path=r'C:\Users\ewuxyuq\Desktop\framework\simhei.ttf'
                         ).generate(wl_space_split)
my_wordcloud.to_file('wechat.jpg')


运行一下:

640.jpg


这样,朋友圈签名的所有分析就完成了。

看看自己的朋友圈,都是励志的正能量啊,所以,大家今后还要更加努力加油啊!


完整代码见GitHub:

https://github.com/johnturingwu/helloworld/blob/master/weixin.py


点击阅读原文直接到达。

相关文章
|
12月前
|
Web App开发 JSON JavaScript
爬取王者荣耀图片
【10月更文挑战第11天】爬取王者荣耀图片。
448 2
|
移动开发 HTML5
动漫二次元漂亮的网站导航HTML5源码
二次元漂亮网站导航HTML源码,页面中还调用了很多外站的图片等链接需自行更换。
430 4
欢迎来到王者荣耀!
欢迎来到王者荣耀!
436 1
|
数据采集 Web App开发 开发者
探秘Python爬虫技术:王者荣耀英雄图片爬取
探秘Python爬虫技术:王者荣耀英雄图片爬取
|
11月前
|
API
图片转ASCII图片(像素图,艺术图)免费API接口教程
此API可将指定图片转换为ASCII风格或像素风格图片。支持POST/GET请求,需提供用户ID、KEY及图片等参数,可选设置背景色、文本色、图片宽度、灰度及风格。返回状态码、提示信息及图片地址。示例及详情见官网。
|
人工智能 Serverless 开发者
|
机器学习/深度学习 编解码 自然语言处理
PAI-Diffusion中文模型全面升级,海量高清艺术大图一键生成
本文主要介绍-Diffusion中文模型大幅升级,本文详细介绍PAI-Diffusion中文模型的新功能和新特性。
PAI-Diffusion中文模型全面升级,海量高清艺术大图一键生成
|
机器学习/深度学习 人工智能 PyTorch
神工鬼斧惟肖惟妙,M1 mac系统深度学习框架Pytorch的二次元动漫动画风格迁移滤镜AnimeGANv2+Ffmpeg(图片+视频)快速实践
前段时间,业界鼎鼎有名的动漫风格转化滤镜库AnimeGAN发布了最新的v2版本,一时间街谈巷议,风头无两。提起二次元,目前国内用户基数最大的无疑是抖音客户端,其内置的一款动画转换滤镜“变身漫画”,能够让用户在直播中,把自己的实际外貌转换为二次元“画风”。对于二次元粉丝来说,“打破次元壁,变身纸片人”这种自娱自乐方式可谓屡试不爽
神工鬼斧惟肖惟妙,M1 mac系统深度学习框架Pytorch的二次元动漫动画风格迁移滤镜AnimeGANv2+Ffmpeg(图片+视频)快速实践
|
Java 应用服务中间件 开发工具
SpringBoot简介、案例步骤及与Spring的对比
SpringBoot简介、案例步骤及与Spring的对比
120 0
|
数据采集 Java Web App开发
爬取英雄联盟皮肤图片
使用爬虫相关知识,进行爬取英雄联盟皮肤图片。
258 0