WordCloud词云库实战(二)

简介: WordCloud词云库实战(二)

写在前面

昨天我们讲了英文词云绘制,今天我们来试试中文词云,首先我们需要一本道德经



读取文件


#-*- coding:utf-8 -*-
with open('C:\\Users\\Administrator\\Desktop\\daode.txt',errors='ignore') as read_file:#读取文本
    data=read_file.read()
    print(data)


读取出来咋用啊,还是逐行读取为字符串吧


data = ''
with open('C:\\Users\\Administrator\\Desktop\\daode.txt',errors='ignore') as f:#逐行读取文本为str
    for line in f.readlines():
        line = line.strip()
        data += line
        print(data)


去一下标点符号


from string import punctuation
str = data
add_punc=',。、【】“”:;()《》‘’{}?!⑦()、%^>℃:.”“^-——=擅长于的&#@¥' # 去除字符串内的符号
all_punc = punctuation + add_punc
temp = []
for c in str:
    if c not in all_punc :
        temp.append(c)
newText = ''.join(temp)
print(newText)


去除数字


from string import digits
s = newText
remove_digits = str.maketrans('', '', digits)#去除字符串内的数字
res = s.translate(remove_digits)
print(res)


结巴(jieba)分词


import jieba
mytext = " ".join(jieba.cut(res))
print(mytext)


可视化


import wordcloud
c = wordcloud.WordCloud(background_color='white')#1.配置对象参数,背景色换为白色
wenzi = "He is busy every day. He has many thing to do. He has no time to go home for lunch. He gets home at 7:00 p.m. At home he does the housework. He cooks nice dishes for mother and me."
c.generate(mytext)  #2.加载词云文本
c.to_file("pywordcloud.png")#3.输出词云文件

懵逼了吧,宝儿,这是因为matplotlib默认字体是不包含中文的,所以我们要给他的参数定义一个字体

import wordcloud
c = wordcloud.WordCloud(font_path="msyh.ttc",background_color='white')#1.配置对象参数,背景色换为白色
wenzi = "He is busy every day. He has many thing to do. He has no time to go home for lunch. He gets home at 7:00 p.m. At home he does the housework. He cooks nice dishes for mother and me."
c.generate(mytext)  #2.加载词云文本
c.to_file("pywordcloud.png")#3.输出词云文件


目录
相关文章
Python绘图神器Matplotlib、Echarts、Pyecharts 和 Plotly ——可绘制各种图
Python绘图神器Matplotlib、Echarts、Pyecharts 和 Plotly ——可绘制各种图
Python绘图神器Matplotlib、Echarts、Pyecharts 和 Plotly ——可绘制各种图
|
3月前
|
自然语言处理 搜索推荐 数据可视化
如何使用python实现一个优雅的词云?(超详细)
如何使用python实现一个优雅的词云?(超详细)
82 2
|
5月前
|
搜索推荐 Python Windows
python中对于wordcloud词云生成报错提示的解决
通过搜索印象错误信息:ValueError:Only supported for TrueType fonts,几乎大部分人给出的选项都是让你指定TrueType fonts路径,或者新下载TTF字体,并重新指定,但是这两种解决方案并无法解决报错。 在真正解决问题之前,先来介绍几个与之相关的知识点,对于有经验的人,这样的知识点完全是“小菜”,但是对于初学者,这种知识点就是因为缺少相关实践而无从下手,无从搜索引擎。
|
5月前
|
数据采集 自然语言处理 数据可视化
拿来及用的Python词云图代码 | wordcloud生成词云详解
词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息。今天,我们就来学习一下Python生成词云的常用库wordcloud。
|
12月前
|
算法 数据可视化 JavaScript
Python如何使用Pyecharts+TextRank生成词云图?
Python如何使用Pyecharts+TextRank生成词云图?
94 0
|
Python
【Python】【Matplotlib】词云图
关于从网页获取文本
84 0
|
数据可视化 Python
WordCloud词云库快速入门(一)
wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。
375 0
|
人工智能 自然语言处理 Python
Python 词云图:wordcloud库的使用
Python 词云图:wordcloud库。安装,使用,常用函数方法,配置对象参数,蒙版,配色集。水浒传词云图代码实例。
470 0
Python 词云图:wordcloud库的使用
pyecharts第七节、词云图
pyecharts第七节、词云图
125 0
pyecharts第七节、词云图