python生成词云图

简介: python生成词云图

生成词云图的话需要先对数据进行分词处理 , 分词方法点击查看

import pandas as pd
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 假设您已经按照之前的步骤处理了数据,并且处理后的数据保存在'comments_processed.csv'文件中
# 读取处理后的数据
df = pd.read_csv('comments_processed.csv', encoding='utf-8-sig')
# 假设处理后的词汇存储在'connected_words'列中
words = ' '.join(df['connected_words'].values)
cleaned_stt = ' '.join(words.strip().split())
# 使用 split() 方法将字符串分割为列表
word_list = cleaned_stt.split(' ')
word_counts = Counter(word_list)
# 提取前20个高频词(如果词的数量少于20个,则提取所有)
top_words = word_counts.most_common(80)
# 准备用于生成词云的数据
# 将高频词和它们的词频分开
top_words_list, top_words_freq = zip(*top_words)
# 将词频列表转换为字典,用于wordcloud的权重参数
word_freq_dict = dict(top_words)
word_freq_dict1 = {'性能': 3351, '外观': 1086, '舒适': 806, '环保': 591, '智能': 433, '越野': 416, '坐在': 400, '前排': 389, '东西': 367, '拥挤': 360, '座椅': 338, '很大': 305, '储物': 304, '不错': 303, '车子': 277, '足够': 266, '腿部': 263, '舒服': 242, '设计': 238, '车内': 231}
word_freq_dict.update(word_freq_dict1)
print(word_freq_dict)
# 创建词云对象,并指定字体(确保支持中文)
wordcloud = WordCloud(width=1200, height=800, background_color='white',
                      font_path=fr'fonts\xiawuxiheixinban.ttf'  # 或者其他支持中文的字体文件路径
                      ).generate_from_frequencies(word_freq_dict)
# 显示词云图
plt.figure(figsize=(8, 8), facecolor=None)
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.tight_layout(pad=0)
plt.show()


相关文章
|
6月前
|
机器学习/深度学习 自然语言处理 数据可视化
基于Python+词云图+情感分析对某东上完美日记的用户评论分析
基于Python+词云图+情感分析对某东上完美日记的用户评论分析
344 0
基于Python+词云图+情感分析对某东上完美日记的用户评论分析
|
5月前
|
数据采集 自然语言处理 搜索推荐
python【包含数据预处理】基于词频生成词云图
背景目的 有一篇中文文章,或者一本小说。想要根据词频来生成词云图。
|
3月前
|
自然语言处理 数据可视化 搜索推荐
用Python制作酷炫词云图,原来这么简单!
用Python制作酷炫词云图,原来这么简单!
|
4月前
|
数据采集 自然语言处理 大数据
​「Python大数据」词频数据渲染词云图导出HTML
使用Python,本文展示数据聚类和办公自动化,焦点在于通过jieba分词处理VOC数据,构建词云图并以HTML保存。`wordCloud.py`脚本中,借助pyecharts生成词云,如图所示,关键词如"Python"、"词云"等。示例代码创建了词云图实例,添加词频数据,并输出到"wordCloud.html"。
88 1
​「Python大数据」词频数据渲染词云图导出HTML
|
5月前
|
数据采集 自然语言处理 搜索推荐
python 【包含数据预处理】基于词频生成词云图
这段文本是关于如何使用Python基于词频生成词云图的教程。内容包括:1) 中文分词的必要性,因中文无明显单词边界及语言单位特性;2) 文本预处理步骤,如移除特殊符号、网址、日期等;3) 使用`data_process`函数清除无用字符;4) `getText`函数读取并处理文本为句子数组;5) 使用jieba分词库进行分词和词频统计;6) 示例代码展示了从分词到生成词云的完整流程,最后展示生成的词云图。整个过程旨在从中文文本中提取关键词并可视化。
161 5
python 【包含数据预处理】基于词频生成词云图
|
5月前
|
数据采集 自然语言处理 数据可视化
拿来及用的Python词云图代码 | wordcloud生成词云详解
词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息。今天,我们就来学习一下Python生成词云的常用库wordcloud。
|
6月前
|
机器学习/深度学习 自然语言处理 数据可视化
用Python分析文本数据的词频并词云图可视化
用Python分析文本数据的词频并词云图可视化
191 0
|
6月前
|
自然语言处理 数据处理 Python
python安娜卡列妮娜词云图制作
python安娜卡列妮娜词云图制作
|
6月前
|
自然语言处理 数据可视化 搜索推荐
手把手教你使用Python打造绚丽的词云图
手把手教你使用Python打造绚丽的词云图
521 0
手把手教你使用Python打造绚丽的词云图
|
6月前
|
Python
python绘制词云图
python绘制词云图
72 0