WordCloud词云库快速入门(一)

简介: wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。

WordCloud简介

wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。


安装


pip install wordcloud#安装


绘制一个超级简单的词云


import wordcloud
c=wordcloud.WordCloud()#1.配置对象参数
wenzi = "He is busy every day. He has many thing to do. He has no time to go home for lunch. He gets home at 7:00 p.m. At home he does the housework. He cooks nice dishes for mother and me."
c.generate(wenzi) #2.加载词云文本
c.to_file("pywordcloud.png")#3.输出词云文件



参数

他是默认输出,看起来有点丑,我们把背景换成白色试试


import wordcloud
c = wordcloud.WordCloud(background_color='white')#1.配置对象参数,背景色换为白色
wenzi = "He is busy every day. He has many thing to do. He has no time to go home for lunch. He gets home at 7:00 p.m. At home he does the housework. He cooks nice dishes for mother and me."
c.generate(wenzi)  #2.加载词云文本
c.to_file("pywordcloud.png")#3.输出词云文件


可以看出,我们能通过更改参数来控制WordCloud绘制的词云,以下是常用的参数

fontpath:字符型,用于传入本地特定字体文件的路径(ttf或otf文件)从而影响词云图的字体族

width:int型,用于控制词云图画布宽度,默认为400

height:int型,用于控制词云图画布高度,默认为200

prefer_horizontal:float型,控制所有水平显示的文字相对于竖直显示文字的比例,越小则词云图中竖直显示的文字越多

mask:传入蒙版图像矩阵,使得词云的分布与传入的蒙版图像一致

contour:float型,当mask不为None时,contour参数决定了蒙版图像轮廓线的显示宽度,默认为0即不显示轮廓线

contour_color:设置蒙版轮廓线的颜色,默认为’black’

scale:当画布长宽固定时,按照比例进行放大画布,如scale设置为1.5,则长和宽都是原来画布的1.5倍

min_font_size:int型,控制词云图中最小的词对应的字体大小,默认为4

max_font_size:int型,控制词云图中最大的词对应的字体大小,默认为200

max_words:int型,控制一张画布中最多绘制的词个数,默认为200

stopwords:控制绘图时忽略的停用词,即不绘制停用词中提及的词,默认为None,即调用自带的停用词表(仅限英文,中文需自己提供并传入)

background_color:控制词云图背景色,默认为’black’

mode:当设置为’RGBA’且background_color设置为None时,背景色变为透明,默认为’RGB’

relative_scaling:float型,控制词云图绘制字的字体大小与对应字词频的一致相关性,当设置为1时完全相关,当为0时完全不相关,默认为0.5

color_func:传入自定义调色盘函数,默认为None

colormap:对应 matplotlib中的colormap调色盘,默认为 viridis,这个参数与参数 color_func互斥,当 color_func有函数传入时本参数失效

repeat:bool型,控制是否允许一张词云图中出现重复词,默认为False即不允许重复词

random_state:控制随机数水平,传入某个固定的数字之后每一次绘图文字布局将不会改变


不同形状的词云

接下来,我们在这个词云的基础上添加一个五角星

利用PIL模块读取我们的五角星图片文件并转换为numpy数组,作为WordCloud的mask参数传入:


from PIL import Image
import numpy as np
ziyan_mask = np.array(Image.open(r'C:\Users\Administrator\Desktop\R-C.png'))#读取图片
c = wordcloud.WordCloud(background_color='white',mask = ziyan_mask)#1.配置对象参数,背景色换为白色
wenzi = "He is busy every day. He has many thing to do. He has no time to go home for lunch. He gets home at 7:00 p.m. At home he does the housework. He cooks nice dishes for mother and me."
c.generate(wenzi)  #2.加载词云文本
c.to_file("pywordcloud.png")#3.输出词云文件

虽然有点丑,但大概就是这个意思~~~,,,明天见


目录
相关文章
|
5月前
|
自然语言处理 搜索推荐 数据可视化
如何使用python实现一个优雅的词云?(超详细)
如何使用python实现一个优雅的词云?(超详细)
122 2
|
7月前
|
搜索推荐 Python Windows
python中对于wordcloud词云生成报错提示的解决
通过搜索印象错误信息:ValueError:Only supported for TrueType fonts,几乎大部分人给出的选项都是让你指定TrueType fonts路径,或者新下载TTF字体,并重新指定,但是这两种解决方案并无法解决报错。 在真正解决问题之前,先来介绍几个与之相关的知识点,对于有经验的人,这样的知识点完全是“小菜”,但是对于初学者,这种知识点就是因为缺少相关实践而无从下手,无从搜索引擎。
|
7月前
|
数据采集 自然语言处理 数据可视化
拿来及用的Python词云图代码 | wordcloud生成词云详解
词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息。今天,我们就来学习一下Python生成词云的常用库wordcloud。
|
算法 数据可视化 JavaScript
Python如何使用Pyecharts+TextRank生成词云图?
Python如何使用Pyecharts+TextRank生成词云图?
102 0
|
Python
【Python】【Matplotlib】词云图
关于从网页获取文本
102 0
|
自然语言处理 数据可视化 Python
WordCloud词云库实战(二)
WordCloud词云库实战(二)
108 0
|
人工智能 自然语言处理 Python
Python 词云图:wordcloud库的使用
Python 词云图:wordcloud库。安装,使用,常用函数方法,配置对象参数,蒙版,配色集。水浒传词云图代码实例。
503 0
Python 词云图:wordcloud库的使用
|
自然语言处理 Python
手把手教你用Python绘制词云
手把手教你用Python绘制词云
426 0
手把手教你用Python绘制词云
|
数据挖掘 Python
Python数据分析与展示:matplotlib绘图库入门-6
Python数据分析与展示:matplotlib绘图库入门-6
207 0
Python数据分析与展示:matplotlib绘图库入门-6

热门文章

最新文章