WordCloud实现词云实例

简介: 代码如下
# 微博内容分析——词云
def wordcloud(df):
    tomato_str = ' '.join(df['内容'])
    words_list = []  # 保存词汇的列表
    # 分词
    word_generator = jieba.cut_for_search(tomato_str)
    for word in word_generator:
        words_list.append(word)  # 将拆分后的词汇添加至列表当中
    words_list = [k for k in words_list if len(k) > 2]  # 筛选词汇长度大于1的
    # words_list.remove('视频')
    # words_list.remove('全文')
    # words_list.remove('微博')
    back_color = imageio.imread('./images/词云背景.jpg')  # 读取图片
    wc = WordCloud(background_color='white',  # 背景颜色
                   max_words=200,  # 最大词数
                   mask=back_color,  # 以该参数值作图绘制词云,这个参数不为空时,width和height会被忽略
                   max_font_size=300,  # 显示字体的最大值
                   font_path="./images/STFANGSO.ttf",  # 字体
                   random_state=42,  # 为每个词返回一个PIL颜色
                   width=1000,  # 图片的宽
                   height=860  # 图片的长
                   )
    tomato_count = collections.Counter(words_list)  # 统计数量
    wc.generate_from_frequencies(tomato_count)  # 生成词云图
    # wc.generate(words_list)
    # 保存词云图片
    wc.to_file(('./images/微博内容词云.png'))
    print('完成!!')
目录
相关文章
|
自然语言处理 Python
wordcloud:自定义背景图片,生成词云
wordcloud:自定义背景图片,生成词云
1889 0
wordcloud:自定义背景图片,生成词云
|
1月前
|
Python
Matplotlib 教程 之 Matplotlib 绘制多图 1
这段代码介绍了如何使用 Matplotlib 库中的 `subplot()` 方法在同一画布上绘制多个子图。通过指定行数(`nrows`)、列数(`ncols`)以及子图的位置序号(`index`),可以在一个整体图像中布局多个独立的图表。例如,`subplot(1, 2, 1)` 和 `subplot(1, 2, 2)` 分别指定了在一个 1 行 2 列的网格中的第一个和第二个位置。示例展示了如何创建两个子图,并分别为它们添加标题。
19 4
|
1月前
|
数据可视化 Python
Matplotlib 教程 之 Matplotlib 轴标签和标题 1
使用 Matplotlib 的 `xlabel()` 和 `ylabel()` 方法为 x 轴和 y 轴添加标签。通过简单的 NumPy 数组操作和 Matplotlib 的绘图功能,您可以轻松地为图表添加描述性的轴标签,使数据可视化更加清晰明了。
132 5
|
1月前
|
前端开发 Python
Matplotlib 教程 之 Matplotlib 轴标签和标题 3
使用 Matplotlib 的 `title()`, `xlabel()`, 和 `ylabel()` 方法来设置图表标题及轴标签的位置,并通过实例展示了如何利用 `loc` 参数实现标题和标签的定位,同时演示了如何设置中文字体和样式。
23 1
|
1月前
|
Python
Matplotlib 教程 之 Matplotlib 绘制多图 2
subplot()` 需要手动指定位置参数,而 `subplots()` 可以一次性生成多个子图,只需调用生成对象的 `ax`。示例代码展示了如何在一个 2x2 的网格中绘制四个不同的子图,并为每个子图设置了标题,最后还添加了一个总标题 "Baidu subplot Test"。
17 0
|
1月前
|
关系型数据库 Python
Matplotlib 教程 之 Matplotlib 绘制多图 3
`subplot()` 需要手动指定位置,而 `subplots()` 可一次性生成多个子图,通过 `ax` 对象进行调用。`subplots()` 方法支持多种参数,如设置行列数 (`nrows`, `ncols`)、共享轴 (`sharex`, `sharey`) 等。示例展示了不同场景下的子图绘制方法,包括共享轴、极坐标图等。
21 0
|
1月前
|
Python
Matplotlib 教程 之 Matplotlib 轴标签和标题 2
使用 Matplotlib 设置图表标题和轴标签。通过 `title()`, `xlabel()`, 和 `ylabel()` 方法,可以分别为图表添加标题和 x、y 轴的标签。
14 0
|
5月前
|
数据采集 自然语言处理 数据可视化
拿来及用的Python词云图代码 | wordcloud生成词云详解
词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息。今天,我们就来学习一下Python生成词云的常用库wordcloud。
|
自然语言处理
绘图系列|R-wordcloud2包绘制词云
绘图系列|R-wordcloud2包绘制词云
116 0
|
自然语言处理 数据可视化 Python
WordCloud词云库实战(二)
WordCloud词云库实战(二)
100 0