WordCloud实现词云实例

简介: 代码如下
# 微博内容分析——词云
def wordcloud(df):
    tomato_str = ' '.join(df['内容'])
    words_list = []  # 保存词汇的列表
    # 分词
    word_generator = jieba.cut_for_search(tomato_str)
    for word in word_generator:
        words_list.append(word)  # 将拆分后的词汇添加至列表当中
    words_list = [k for k in words_list if len(k) > 2]  # 筛选词汇长度大于1的
    # words_list.remove('视频')
    # words_list.remove('全文')
    # words_list.remove('微博')
    back_color = imageio.imread('./images/词云背景.jpg')  # 读取图片
    wc = WordCloud(background_color='white',  # 背景颜色
                   max_words=200,  # 最大词数
                   mask=back_color,  # 以该参数值作图绘制词云,这个参数不为空时,width和height会被忽略
                   max_font_size=300,  # 显示字体的最大值
                   font_path="./images/STFANGSO.ttf",  # 字体
                   random_state=42,  # 为每个词返回一个PIL颜色
                   width=1000,  # 图片的宽
                   height=860  # 图片的长
                   )
    tomato_count = collections.Counter(words_list)  # 统计数量
    wc.generate_from_frequencies(tomato_count)  # 生成词云图
    # wc.generate(words_list)
    # 保存词云图片
    wc.to_file(('./images/微博内容词云.png'))
    print('完成!!')
目录
相关文章
|
自然语言处理 Python
wordcloud:自定义背景图片,生成词云
wordcloud:自定义背景图片,生成词云
1880 0
wordcloud:自定义背景图片,生成词云
|
1月前
|
Python
Matplotlib 教程 之 Matplotlib 绘制多图 1
这段代码介绍了如何使用 Matplotlib 库中的 `subplot()` 方法在同一画布上绘制多个子图。通过指定行数(`nrows`)、列数(`ncols`)以及子图的位置序号(`index`),可以在一个整体图像中布局多个独立的图表。例如,`subplot(1, 2, 1)` 和 `subplot(1, 2, 2)` 分别指定了在一个 1 行 2 列的网格中的第一个和第二个位置。示例展示了如何创建两个子图,并分别为它们添加标题。
19 4
|
1月前
|
关系型数据库 Python
Matplotlib 教程 之 Matplotlib 绘制多图 3
`subplot()` 需要手动指定位置,而 `subplots()` 可一次性生成多个子图,通过 `ax` 对象进行调用。`subplots()` 方法支持多种参数,如设置行列数 (`nrows`, `ncols`)、共享轴 (`sharex`, `sharey`) 等。示例展示了不同场景下的子图绘制方法,包括共享轴、极坐标图等。
20 0
|
1月前
|
Python
Matplotlib 教程 之 Matplotlib 绘制多图 2
subplot()` 需要手动指定位置参数,而 `subplots()` 可以一次性生成多个子图,只需调用生成对象的 `ax`。示例代码展示了如何在一个 2x2 的网格中绘制四个不同的子图,并为每个子图设置了标题,最后还添加了一个总标题 "Baidu subplot Test"。
17 0
|
5月前
|
数据采集 自然语言处理 数据可视化
拿来及用的Python词云图代码 | wordcloud生成词云详解
词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息。今天,我们就来学习一下Python生成词云的常用库wordcloud。
|
数据可视化 搜索推荐 API
Pygal
Pygal是一个基于Python的开源数据可视化库,用于创建交互式矢量图。它使用简单且直观的语法,旨在帮助用户轻松地生成各种类型的图表,如线图、柱状图、饼图、散点图等。
154 0
|
自然语言处理
绘图系列|R-wordcloud2包绘制词云
绘图系列|R-wordcloud2包绘制词云
116 0
|
自然语言处理 数据可视化 Python
WordCloud词云库实战(二)
WordCloud词云库实战(二)
99 0
|
数据可视化 Python
WordCloud词云库快速入门(一)
wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。
375 0
|
JavaScript
使用vue-wordcloud实现文字云/词云
在项目里面,通过npm安装下载,使用demo
779 0
使用vue-wordcloud实现文字云/词云