python生成词云教程(附带QQ聊天记录生成词云实战)

简介: python生成词云教程(附带QQ聊天记录生成词云实战)

很多同学对词云很感兴趣,就是给一段文本,然后根据它的词频,生成出好看的词云,就像下面这张图一样:

image.png

生成这个其实很简单,python代码我已经放在github上面了,大家下载下来就能直接用:

https://github.com/godweiyang/wordcloud

下面我讲讲怎么使用这个代码。

环境配置


首先需要python3环境,推荐使用Anaconda安装。

然后需要 jiebawordcloud库,所以运行下面两条命令安装两个库: pip3 install jiebapip3 install wordcloud

文件目录

这个代码文件夹是如下结构:

  • data
  • templates 这个文件夹下放所有你词云想要的样式图片,背景色最好简单一点。
  • stopwords.txt 这是停止词文件,对于你不想在词云中出现的词,你都可以添加到这个文件中过滤掉它。
  • fonts 这个文件夹下放词云中显示的字体。
  • create_word_cloud.py 这是词云的主代码。
  • preprocess.py 这是用来预处理QQ聊天记录的。

使用方法


对于一般的文本文件,直接运行 python3 create_word_cloud.py filename.txt就能生成词云了,效果如下:

image.png

生成QQ聊天记录词云


首先打开消息记录,点击下方的消息管理器:

image.png

然后在需要导出的聊天对象上面右键点击导出消息记录:

image.png

然后保存类型选择 txt,点保存,并将文件保存在 wordcloud根目录下:

image.png

然后打开命令行运行 python3 preprocess.py filename.txt,用来去掉聊天记录中的昵称和时间等信息:


最后运行 python3 create_word_cloud.py __filename.txt就能生成词云了。


相关文章
|
5天前
|
数据安全/隐私保护 Python
Python以及基础语法保姆级教程(超详细)-3
Python以及基础语法保姆级教程(超详细)
|
5天前
|
存储 Python 容器
Python以及基础语法保姆级教程(超详细)-2
Python以及基础语法保姆级教程(超详细)
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
豆瓣评分9.5!清华大牛熬夜整理的Python深度学习教程开发下载!
深度学习目前已经成为了人工智能领域的突出话题。它在“计算机视觉和游戏(AlphaGo)等领域的突出表现而闻名。 今天给小伙伴们分享的这份手册,详尽介绍了用 Python 和 Keras进行深度学习的探索实践,涉及计算机视觉、自然语言处理、生成式模型等应用。
|
1天前
|
Unix Shell Python
Python教程:开箱即用的Python os模块知识
注:文末有福利小工具源码 Python 的 os 模块提供了许多接口用于与操作系统进行交互,包括文件操作、目录操作、路径操作、环境变量操作、系统信息获取等
10 1
|
1天前
|
数据采集 索引 Python
Python教程:一文弄懂Python字符串(很详细)
字符串是计算机编程中表示文本数据的一种数据类型。在Python和许多其他编程语言中,字符串是由字符序列组成的不可变序列,可以包含字母、数字、符号以及空格等字符。字符串通常用引号括起来表示,可以使用单引号(')、双引号(")或三引号('''或""")来定义。 字符串在计算机编程中有着广泛的应用,例如表示文本信息、文件内容、用户输入等。字符串可以进行各种操作,如连接(拼接)、切片、查找、替换等,同时还支持大小写转换、格式化和正则表达式等高级处理。
27 0
|
2天前
|
程序员 Python
GitHub爆赞!最适合新手入门的教程——笨方法学Python 3
“Python 是一门既容易上手又强大的编程语言。”这句话本身并无大碍,但需要注意的是,正因为它既好学又好用,所以很多 Python 程序员只用到了其强大功能的一小部分。 今天给小伙伴们分享的这份手册以习题的方式引导读者一步一步学习编程,从简单的打印一直讲到完整项目的实现。
|
3天前
|
数据采集 存储 数据挖掘
Python网络爬虫实战:抓取并分析网页数据
使用Python的`requests`和`BeautifulSoup`,本文演示了一个简单的网络爬虫,抓取天气网站数据并进行分析。步骤包括发送HTTP请求获取HTML,解析HTML提取温度和湿度信息,以及计算平均温度。注意事项涉及遵守robots.txt、控制请求频率及处理动态内容。此基础爬虫展示了数据自动收集和初步分析的基础流程。【6月更文挑战第14天】
60 9
|
3天前
|
数据采集 数据可视化 数据挖掘
数据挖掘实战:使用Python进行数据分析与可视化
在大数据时代,Python因其强大库支持和易学性成为数据挖掘的首选语言。本文通过一个电商销售数据案例,演示如何使用Python进行数据预处理(如处理缺失值)、分析(如销售额时间趋势)和可视化(如商品类别销售条形图),揭示数据背后的模式。安装`pandas`, `numpy`, `matplotlib`, `seaborn`后,可以按照提供的代码步骤,从读取CSV到数据探索,体验Python在数据分析中的威力。这只是数据科学的入门,更多高级技术等待发掘。【6月更文挑战第14天】
31 11
|
4天前
|
数据采集 机器学习/深度学习 数据可视化
数据挖掘实战:Python在金融数据分析中的应用案例
Python在金融数据分析中扮演关键角色,用于预测市场趋势和风险管理。本文通过案例展示了使用Python库(如pandas、numpy、matplotlib等)进行数据获取、清洗、分析和建立预测模型,例如计算苹果公司(AAPL)股票的简单移动平均线,以展示基本流程。此示例为更复杂的金融建模奠定了基础。【6月更文挑战第13天】
20 3
|
5天前
|
数据采集 前端开发 Python
Python3网络开发实战读后感
Python3网络开发实战读后感