手把手教你用Python绘制词云

简介: 手把手教你用Python绘制词云

手把手教你用Python绘制词云

   wordcloud库把词云当做一个WordCloud对象,库名是全小写,词名是有大写有小写的。


       wordcloud.WorldCloud代表一个文本对应的词云。我们可以这样理解在worldcloud库中,WordCloud是一个代表文本词云的对象。


   一个词云就是一个WordeCloud对象,可以根据文本中词语出现的频率等参数绘制词云,词云的形状,尺寸,颜色都可以设定。


Wordcloud库的常用方法

w=wordcloud.WordCloud()  来表明一个词云对象

-以WordCloud对象为基础

-配置参数,加载文本,输出文件

image.png

★重点重点★

简单说绘制一个词云有三步

步骤一:配置对象参数

步骤二:加载词云文本

步骤三:输出词云文件


看下面的例子:

image.png

输出结果:

image.png

       在上面的程序中 ,wordcloud做了四件事情:

首先对于一个文本

1.分隔:以空格分隔单词

2. 统计:统计单词出现的次数并过滤(次数多的显示的大,少的小)

3. 字体:根据统计配置字号

4. 布局:颜色环境尺寸


       从上面的步骤可以看出,在绘制词云的时候,原则上不需要我们对单词出现的数量进行统计,只需要给wordcloud库空格分隔的大字符串,就可以产生词云。


下面来看一下生成词云对象的时候还有哪些参数:

w=wordcloud.WordCloud(<参数>)


width 指定词云对象生成图片的宽度,默认400像素

       如:w=wordcloud.WordCloud(<width=400>)


height 指定词云对象生成图片的高度,默认200像素

       如: w=wordcloud.WordCloud(<height=200>)

除了图片大小,还有字体

image.png

还有一些常用参数:

font_path 指定字体文件的路径,默认NONE,指定字体

max_words 指定词云显示的最大单词数量,默认200

stop_path 指定词云的排除词列表,既不显示的单词列表


我们再来看一个小例子

image.png


       接着我们来看中文,英文是用空格来分割单词,但是空格是没法分隔中文的,所以在形成词云时,需要我们先对中文进行分隔。


看代码

image.png

运行结果如下所示:

image.png

未完待续

政府工作报告云


需求:对于政府工作报告等政策文件,如何直观观察理解

体会直观的价值:生成词云  优化词云


第一份文件


First

《决胜全面建成小康社会,夺取新时代中国特色社会主义未带胜利》(2017年10月18日  在中国共产党第十九次全国代表大会报告)


下载地址:https://python123.io/resources/pye/新时代中国特色社会主义.txt

第二份文件


second

《中共中央 国务院关于实施乡村振兴战略的意见》

2018一号文件 (2018年01月02日)


下载地址:https://python123.io/resources/pye/关于实施乡村振兴战略的意见.txt


       我们来展示一下第一份文件的词云代码,代码不多,很容易理解。

image.png

运行结果如下所示:

image.png


       如果感觉出现的字太多的话们可以更改一下

max_words参数,如:max_words=15


如果想生成有形状的词云,那该怎么办呢?

       还能怎么办,接着往下看啊。看下面这个汽车图片,帅不帅?

image.png

   

       函数里面存在了mask参数,我们可以把这个参数用上,如下所示:

image.png

       效果图如下,如果你的字数太少,记得修max_words的值。

image.png

       感兴趣的的你可以去试试第二份文件,把里面的内容生成自己想要的词云。

目录
相关文章
|
7月前
|
机器学习/深度学习 自然语言处理 数据可视化
数据代码分享|PYTHON用NLP自然语言处理LSTM神经网络TWITTER推特灾难文本数据、词云可视化
数据代码分享|PYTHON用NLP自然语言处理LSTM神经网络TWITTER推特灾难文本数据、词云可视化
|
2月前
|
自然语言处理 Python Windows
python知识点100篇系列(23)- 使用stylecloud生成词云
【10月更文挑战第10天】`stylecloud` 是 `wordcloud` 的优化版,支持使用 Font Awesome 图标自定义词云形状,操作更简便。本文介绍如何安装 `jieba` 和 `stylecloud` 库,并使用它们生成中文词云。通过 `jieba` 进行分词,再利用 `stylecloud` 的 `gen_stylecloud` 方法生成具有特定形状和颜色的词云图像。
python知识点100篇系列(23)- 使用stylecloud生成词云
|
2月前
|
自然语言处理 计算机视觉 Python
用 Python 创建词云
用 Python 创建词云
35 2
|
4月前
|
自然语言处理 搜索推荐 数据可视化
如何使用python实现一个优雅的词云?(超详细)
如何使用python实现一个优雅的词云?(超详细)
110 2
|
4月前
|
自然语言处理 数据可视化 Python
【Python】Python人民的名义-词云-关系图可视化(源码+报告)【独一无二】
【Python】Python人民的名义-词云-关系图可视化(源码+报告)【独一无二】
|
5月前
|
自然语言处理 数据可视化 机器人
如何画一个词云 | python小知识
词云,又称文字云,是文本数据的视觉表示,通过将网络文本或大量文本数据中出现频率较高的“关键词”以不同大小的字体、颜色或形状进行可视化展示,形成类似云的彩色图形。这种视觉上的突出使得浏览者能够一眼扫过文本就领略到文本的主旨,是数据可视化的一种重要形式 【7月更文挑战第6天】
58 0
|
6月前
|
搜索推荐 Python Windows
python中对于wordcloud词云生成报错提示的解决
通过搜索印象错误信息:ValueError:Only supported for TrueType fonts,几乎大部分人给出的选项都是让你指定TrueType fonts路径,或者新下载TTF字体,并重新指定,但是这两种解决方案并无法解决报错。 在真正解决问题之前,先来介绍几个与之相关的知识点,对于有经验的人,这样的知识点完全是“小菜”,但是对于初学者,这种知识点就是因为缺少相关实践而无从下手,无从搜索引擎。
|
6月前
|
数据采集 自然语言处理 数据可视化
拿来及用的Python词云图代码 | wordcloud生成词云详解
词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息。今天,我们就来学习一下Python生成词云的常用库wordcloud。
|
6月前
|
机器学习/深度学习 自然语言处理 数据可视化
文本挖掘与可视化:生成个性化词云的Python实践【7个案例】
词云(Word Cloud),又称为文字云或标签云,是一种用于文本数据可视化的技术,通过不同大小、颜色和字体展示文本中单词的出现频率或重要性。在词云中,更频繁出现的单词会显示得更大,反之则更小。
|
6月前
|
机器学习/深度学习 自然语言处理 数据可视化
文本挖掘与可视化:生成个性化词云的Python实践【7个案例】
词云是文本数据可视化的工具,显示单词频率,直观、美观,适用于快速展示文本关键信息。 - 用途包括关键词展示、数据探索、报告演示、情感分析和教育。 - 使用`wordcloud`和`matplotlib`库生成词云,`wordcloud`负责生成,`matplotlib`负责显示。 - 示例代码展示了从简单词云到基于蒙版、颜色和关键词权重的复杂词云生成。 - 案例覆盖了中文分词(使用`jieba`库)、自定义颜色和关键词权重的词云。 - 代码示例包括读取文本、分词、设置词云参数、显示和保存图像。
453 1
下一篇
DataWorks