本篇制作一下昨天爬虫的词云,删掉CSV文件中的其他多余元素,只留下弹幕保存成txt文件,来制作词云。
作者挑选了一张风筝的照片做底。
代码如下:
from wordcloud import WordCloudfrom scipy.misc import imreadimport jiebaimport matplotlib.pyplot as plt#读入文件with open('少年的你.txt', 'r') as f: text = f.read()#分词cut_text = " ".join(jieba.cut(text))#设置背景图片color_mask = imread('1.png')cloud = WordCloud( # 设置字体,采用宋体 font_path="/Library/Fonts/Songti.ttc", # 设置背景色 background_color='white', # 词云形状 mask=color_mask, # 允许最大词汇 max_words=300, # 最大号字体 max_font_size=200)#转换并保存wCloud = cloud.generate(cut_text)wCloud.to_file('少年的你.png')#方便显示,画出来。plt.imshow(wCloud, interpolation='bilinear')plt.axis('off')plt.show()
运行一下,结果如下:
哈哈,霸屏的“千玺“,看来易烊千玺的演技确实可以,新生代演员的演技确实让我们眼前一亮 。