python生成词云教程(附带QQ聊天记录生成词云实战)

简介: 很多同学对词云很感兴趣,就是给一段文本,然后根据它的词频,生成出好看的词云,python代码我已经放在github上面了,大家下载下来就能直接用:https://github.com/godweiyang/wordcloud下面我讲讲怎么使用这个代码。

环境配置


首先需要python3环境,推荐使用Anaconda安装。

然后需要 jiebawordcloud库,所以运行下面两条命令安装两个库: pip3 install jiebapip3 install wordcloud

文件目录


这个代码文件夹是如下结构:

  • data
  • templates 这个文件夹下放所有你词云想要的样式图片,背景色最好简单一点。
  • stopwords.txt 这是停止词文件,对于你不想在词云中出现的词,你都可以添加到这个文件中过滤掉它。
  • fonts 这个文件夹下放词云中显示的字体。
  • create_word_cloud.py 这是词云的主代码。
  • preprocess.py 这是用来预处理QQ聊天记录的。

使用方法


对于一般的文本文件,直接运行 python3 create_word_cloud.py filename.txt就能生成词云了,效果如下:

8e6be652655e86c736031e17bb134f8e.jpg

生成QQ聊天记录词云


首先打开消息记录,点击下方的消息管理器:

1887f3132c9a74521418960db333a15c.jpg

然后在需要导出的聊天对象上面右键点击导出消息记录:

7648f84ecb6bf5211b92467e49c41813.jpg

然后保存类型选择 txt,点保存,并将文件保存在 wordcloud根目录下:

e3cba99ff92171106334f127736e0c05.jpg

然后打开命令行运行 python3 preprocess.py filename.txt,用来去掉聊天记录中的昵称和时间等信息:


最后运行 python3 create_word_cloud.py __filename.txt就能生成词云了。

相关文章
|
3天前
|
数据安全/隐私保护 Python
Python以及基础语法保姆级教程(超详细)-3
Python以及基础语法保姆级教程(超详细)
|
3天前
|
存储 Python 容器
Python以及基础语法保姆级教程(超详细)-2
Python以及基础语法保姆级教程(超详细)
|
2天前
|
数据采集 存储 数据挖掘
Python网络爬虫实战:抓取并分析网页数据
使用Python的`requests`和`BeautifulSoup`,本文演示了一个简单的网络爬虫,抓取天气网站数据并进行分析。步骤包括发送HTTP请求获取HTML,解析HTML提取温度和湿度信息,以及计算平均温度。注意事项涉及遵守robots.txt、控制请求频率及处理动态内容。此基础爬虫展示了数据自动收集和初步分析的基础流程。【6月更文挑战第14天】
48 9
|
2天前
|
数据采集 数据可视化 数据挖掘
数据挖掘实战:使用Python进行数据分析与可视化
在大数据时代,Python因其强大库支持和易学性成为数据挖掘的首选语言。本文通过一个电商销售数据案例,演示如何使用Python进行数据预处理(如处理缺失值)、分析(如销售额时间趋势)和可视化(如商品类别销售条形图),揭示数据背后的模式。安装`pandas`, `numpy`, `matplotlib`, `seaborn`后,可以按照提供的代码步骤,从读取CSV到数据探索,体验Python在数据分析中的威力。这只是数据科学的入门,更多高级技术等待发掘。【6月更文挑战第14天】
25 11
|
2天前
|
数据采集 机器学习/深度学习 数据可视化
数据挖掘实战:Python在金融数据分析中的应用案例
Python在金融数据分析中扮演关键角色,用于预测市场趋势和风险管理。本文通过案例展示了使用Python库(如pandas、numpy、matplotlib等)进行数据获取、清洗、分析和建立预测模型,例如计算苹果公司(AAPL)股票的简单移动平均线,以展示基本流程。此示例为更复杂的金融建模奠定了基础。【6月更文挑战第13天】
17 3
|
3天前
|
数据采集 前端开发 Python
Python3网络开发实战读后感
Python3网络开发实战读后感
|
3天前
|
程序员 Python
GitHub爆赞!最适合新手入门的教程——笨方法学Python 3
“Python 是一门既容易上手又强大的编程语言。”这句话本身并无大碍,但需要注意的是,正因为它既好学又好用,所以很多 Python 程序员只用到了其强大功能的一小部分。 今天给小伙伴们分享的这份手册以习题的方式引导读者一步一步学习编程,从简单的打印一直讲到完整项目的实现。
|
3天前
|
机器学习/深度学习 Linux 开发者
Python以及基础语法保姆级教程(超详细)-1
Python以及基础语法保姆级教程(超详细)
|
4天前
|
机器学习/深度学习 存储 算法
基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标追踪、运动物体追踪
基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标追踪、运动物体追踪
|
4天前
|
机器学习/深度学习 传感器 算法
基于Mediapipe深度学习算法的手势识别系统【含python源码+PyqtUI界面+原理详解】-python手势识别 深度学习实战项目
基于Mediapipe深度学习算法的手势识别系统【含python源码+PyqtUI界面+原理详解】-python手势识别 深度学习实战项目