应用场景
python封装了很多算法,工具,使用起来非常的方便,它涉及各行各业,比如医疗,生物,数学,计算机,人工智能等,我们不需要使用它的全部,只需要使用我们所需要的一些,可以使代码更加简洁,开发更加方便。
需求场景
一本小说,天龙八部,统计天龙八部小说中,出现的词汇,然后将这些词汇绘制出词云图。
测试代码
import jieba
from wordcloud import WordCloud
f = open('G:\\book\\tlbb.txt','r').read()
s = {}
f = jieba.cut(f)
for w in f:
if len(w) > 1:
previous_count = s.get(w,0)
s[w] = previous_count+1
word = sorted(s.items(),key=lambda (word,count):count, reverse = True)
word = word[1:1000]
#print word[:100]
wordcloud = WordCloud(font_path = 'D:\\Anaconda\\anaconda\\Lib\\site-packages\\matplotlib\\mpl-data\\fonts\\ttf\\MSYHBD.TTF').fit_words(word)
import matplotlib.pyplot as plt
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
运行结果
注:排除无用词汇,将词云图展示成照片形状,做个更加漂亮,自己去摸索吧!