21年政府报告词云python

简介: 21年政府报告词云python

image.png


实验内容

1、题目


21年政府报告词云


2、实验代码


#20203101694 孙成  

from wordcloud import WordCloud, ImageColorGenerator  

from PIL import Image  

import matplotlib.pyplot as plt  

import jieba  

import numpy as np  

 

def test_chinese_text():  

   # 打开文本  

   with open('2021政府工作报告.txt', encoding='utf-8') as f:  

       text = f.read()  

   print(text)  

   # 排除不需要的  

   counts = {}  

   for word in text:  

       if len(word) == 1:  # 排除单个字符的分词结果  

           continue  

       else:  

           counts[word] = counts.get(word, 0) + 1  

   # 生成对象  

   wc = WordCloud(font_path='simhei.ttf', width=800, height=600, mode='RGBA', background_color=None).generate(text)  

   print(wc)  

   # 显示词云  

   plt.imshow(wc, interpolation='bilinear')  

   plt.axis('off')  

   plt.show()  

 

   # 保存到文件  

   wc.to_file('wordcloud.png')  # 生成图像是透明的  

 

def test_english_text():  

   # 打开文件  

   text = open('2021政府工作报告.txt').read()  

 

   # 生成对象  

   wc = WordCloud().generate(text=text)  

 

   # 显示词云  

   plt.imshow(wc, interpolation='bilinear')  

   plt.axis('off')  

   plt.show()  

 

   # 保存文件  

   wc.to_file('wordcloud.png')  

 

def test_ch_text_cut():  

   # 打开文本  

   text = open('2021政府工作报告.txt', encoding='utf-8').read()  

 

   # 中文分词  

   print(jieba.cut(text))  

   text = ' '.join(jieba.cut(text))  

   print(text)  

 

   # 生成对象  

   wc = WordCloud(font_path='simhei.ttf', width=800, height=600, mode='RGBA', background_color=None).generate(text)  

 

   # 显示词云  

   plt.imshow(wc, interpolation='bilinear')  

   plt.axis('off')  

   plt.show()  

   # 保存到文件  

   wc.to_file('wordcloud3.png')  

 

def test_word_cloud_pic():  

   # 打开文本  

   text = open('2021政府工作报告.txt', encoding='utf-8').read()  

 

   # 中文分词  

   text = ' '.join(jieba.cut(text))  

 

  # 生成对象  

   mask = np.array(Image.open("touxiang.JPG"))  

   wc = WordCloud(mask=mask, font_path='simhei.ttf', mode='RGBA', background_color=None).generate(text)  

 

   # 从图片中生成颜色  

   image_colors = ImageColorGenerator(mask)  

   wc.recolor(color_func=image_colors)  

   #显示原始图像  

   im = Image.open('touxiang.JPG')  

   im.show()  

   # 显示词云  

   plt.imshow(wc, interpolation='bilinear')  

   plt.axis("off")  

   plt.show()  

 

   # 保存到文件  

   wc.to_file('wordcloud5.png')  

 

 

if __name__ == '__main__':  

   test_chinese_text()  

   #test_english_text()  

   #test_ch_text_cut()  

   #test_word_cloud_pic()  

3、运行结果


image.png


二、实验报告


请同学们每次实验记得签到,把每次上机的内容保存好,将所有的实验内容压缩为:学号+姓名,统一发给班长,第16到17发送到:346697954@qq.com邮箱。

相关文章
|
3月前
|
自然语言处理 Python Windows
python知识点100篇系列(23)- 使用stylecloud生成词云
【10月更文挑战第10天】`stylecloud` 是 `wordcloud` 的优化版,支持使用 Font Awesome 图标自定义词云形状,操作更简便。本文介绍如何安装 `jieba` 和 `stylecloud` 库,并使用它们生成中文词云。通过 `jieba` 进行分词,再利用 `stylecloud` 的 `gen_stylecloud` 方法生成具有特定形状和颜色的词云图像。
python知识点100篇系列(23)- 使用stylecloud生成词云
|
3月前
|
自然语言处理 计算机视觉 Python
用 Python 创建词云
用 Python 创建词云
44 2
|
5月前
|
自然语言处理 搜索推荐 数据可视化
如何使用python实现一个优雅的词云?(超详细)
如何使用python实现一个优雅的词云?(超详细)
129 2
|
5月前
|
自然语言处理 数据可视化 Python
【Python】Python人民的名义-词云-关系图可视化(源码+报告)【独一无二】
【Python】Python人民的名义-词云-关系图可视化(源码+报告)【独一无二】
|
6月前
|
自然语言处理 数据可视化 机器人
如何画一个词云 | python小知识
词云,又称文字云,是文本数据的视觉表示,通过将网络文本或大量文本数据中出现频率较高的“关键词”以不同大小的字体、颜色或形状进行可视化展示,形成类似云的彩色图形。这种视觉上的突出使得浏览者能够一眼扫过文本就领略到文本的主旨,是数据可视化的一种重要形式 【7月更文挑战第6天】
67 0
|
7月前
|
搜索推荐 Python Windows
python中对于wordcloud词云生成报错提示的解决
通过搜索印象错误信息:ValueError:Only supported for TrueType fonts,几乎大部分人给出的选项都是让你指定TrueType fonts路径,或者新下载TTF字体,并重新指定,但是这两种解决方案并无法解决报错。 在真正解决问题之前,先来介绍几个与之相关的知识点,对于有经验的人,这样的知识点完全是“小菜”,但是对于初学者,这种知识点就是因为缺少相关实践而无从下手,无从搜索引擎。
|
7月前
|
数据采集 自然语言处理 数据可视化
拿来及用的Python词云图代码 | wordcloud生成词云详解
词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息。今天,我们就来学习一下Python生成词云的常用库wordcloud。
|
7月前
|
机器学习/深度学习 自然语言处理 数据可视化
文本挖掘与可视化:生成个性化词云的Python实践【7个案例】
词云(Word Cloud),又称为文字云或标签云,是一种用于文本数据可视化的技术,通过不同大小、颜色和字体展示文本中单词的出现频率或重要性。在词云中,更频繁出现的单词会显示得更大,反之则更小。
|
7月前
|
机器学习/深度学习 自然语言处理 数据可视化
文本挖掘与可视化:生成个性化词云的Python实践【7个案例】
词云是文本数据可视化的工具,显示单词频率,直观、美观,适用于快速展示文本关键信息。 - 用途包括关键词展示、数据探索、报告演示、情感分析和教育。 - 使用`wordcloud`和`matplotlib`库生成词云,`wordcloud`负责生成,`matplotlib`负责显示。 - 示例代码展示了从简单词云到基于蒙版、颜色和关键词权重的复杂词云生成。 - 案例覆盖了中文分词(使用`jieba`库)、自定义颜色和关键词权重的词云。 - 代码示例包括读取文本、分词、设置词云参数、显示和保存图像。
557 1
|
7月前
|
自然语言处理 监控 数据可视化
艺术与文本的交织:基于Python的jieba和wordcloud库实现华丽词云
艺术与文本的交织:基于Python的jieba和wordcloud库实现华丽词云
102 0