pytho机器学习入门之WordCloud的使用(词云,文字云)

简介: pytho机器学习入门之WordCloud的使用(词云,文字云)

词云(wordcloud)也叫文字云 是对文本中出现频率较高的关键词数据给予视觉差异化的展现方式,词云图突出展示高频高质的信息,也能过滤大部分低频的文本,利用词云,可以通过可视化形式凸显数据所体现的主旨,快速显示数据中各种文本信息的频率


from sklearn.datasets import load_iris
from sklearn.datasets import load_boston
import pandas as pd
import pylab
import matplotlib; matplotlib.use('TkAgg')
import matplotlib.pyplot as plt
from wordcloud import WordCloud
from imageio import imread
import numpy as np
f=open(r'zhangsan.txt').read()
bgpic=imread(r'C:\Users\Admin\Desktop\test.jpg')
wdcd=WordCloud(mask=bgpic,background_color="white",scale=1.5)
wdcd=wdcd.generate(f)
plt.imshow(wdcd)
#wordcloud=WordCloud(background_color="white",width=1000,height=860,margin=2).generate(f)
#plt.imshow(wordcloud)
plt.axis("off")
plt.show()
wdcd.to_file('pic.jpg')
pylab.show()
#wordcloud.to_file('1.png')

同样可以自行设置过滤的词


效果如下

1666425008917.jpg

代码如下 测试文件可以自己编写 输入想要的字符


from sklearn.datasets import load_iris
from sklearn.datasets import load_boston
import pandas as pd
import pylab
import matplotlib; matplotlib.use('TkAgg')
import matplotlib.pyplot as plt
from wordcloud import WordCloud
from imageio import imread
import numpy as np
f=open(r'zhangsan.txt').read()
bgpic=imread(r'C:\Users\Admin\Desktop\test.jpg')
wdcd=WordCloud(mask=bgpic,background_color="white",scale=1.5)
wdcd=wdcd.generate(f)
plt.imshow(wdcd)
#wordcloud=WordCloud(background_color="white",width=1000,height=860,margin=2).generate(f)
#plt.imshow(wordcloud)
plt.axis("off")
plt.show()
wdcd.to_file('pic.jpg')
pylab.show()
#wordcloud.to_file('1.png')
相关文章
|
4月前
|
机器学习/深度学习 数据采集 算法
深入了解机器学习:从入门到应用
【10月更文挑战第6天】深入了解机器学习:从入门到应用
|
2月前
|
机器学习/深度学习 传感器 运维
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
本文探讨了时间序列分析中数据缺失的问题,并通过实际案例展示了如何利用机器学习技术进行缺失值补充。文章构建了一个模拟的能源生产数据集,采用线性回归和决策树回归两种方法进行缺失值补充,并从统计特征、自相关性、趋势和季节性等多个维度进行了详细评估。结果显示,决策树方法在处理复杂非线性模式和保持数据局部特征方面表现更佳,而线性回归方法则适用于简单的线性趋势数据。文章最后总结了两种方法的优劣,并给出了实际应用建议。
133 7
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
|
3月前
|
机器学习/深度学习 数据采集
机器学习入门——使用Scikit-Learn构建分类器
机器学习入门——使用Scikit-Learn构建分类器
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI的奥秘:机器学习入门指南
【10月更文挑战第30天】本篇文章是一份初学者友好的机器学习入门指南,旨在帮助读者理解并开始实践机器学习。我们将介绍机器学习的基本概念,包括监督学习、无监督学习和强化学习等。我们还将提供一些实用的代码示例,以帮助读者更好地理解和应用这些概念。无论你是编程新手,还是有一定经验的开发者,这篇文章都将为你提供一个清晰的机器学习入门路径。
65 2
|
3月前
|
机器学习/深度学习 人工智能 算法
机器学习基础:使用Python和Scikit-learn入门
机器学习基础:使用Python和Scikit-learn入门
47 1
|
3月前
|
机器学习/深度学习 数据采集 人工智能
机器学习入门:Python与scikit-learn实战
机器学习入门:Python与scikit-learn实战
107 0
|
3月前
|
机器学习/深度学习 算法 Python
机器学习入门:理解并实现K-近邻算法
机器学习入门:理解并实现K-近邻算法
56 0
|
4月前
|
机器学习/深度学习 人工智能 算法
机器学习基础:使用Python和Scikit-learn入门
【10月更文挑战第12天】本文介绍了如何使用Python和Scikit-learn进行机器学习的基础知识和入门实践。首先概述了机器学习的基本概念,包括监督学习、无监督学习和强化学习。接着详细讲解了Python和Scikit-learn的安装、数据处理、模型训练和评估等步骤,并提供了代码示例。通过本文,读者可以掌握机器学习的基本流程,并为深入学习打下坚实基础。
45 1
|
4月前
|
机器学习/深度学习 人工智能 算法
机器学习基础:使用Python和Scikit-learn入门
本文介绍了如何使用Python和Scikit-learn进行机器学习的基础知识和实践。首先概述了机器学习的基本概念,包括监督学习、无监督学习和强化学习。接着详细讲解了Python和Scikit-learn的安装、数据处理、模型选择与训练、模型评估及交叉验证等关键步骤。通过本文,初学者可以快速上手并掌握机器学习的基本技能。
114 2
|
4月前
|
机器学习/深度学习 人工智能 数据挖掘
机器学习基础:使用Python和Scikit-learn入门
【10月更文挑战第6天】在人工智能领域,机器学习已成为核心技术。本文指导初学者使用Python与Scikit-learn入门机器学习,涵盖基本概念、环境搭建、数据处理、模型训练及评估等环节。Python因简洁性及其生态系统成为首选语言,而Scikit-learn则提供了丰富工具,简化数据挖掘与分析流程。通过实践示例,帮助读者快速掌握基础知识,为进一步深入研究奠定坚实基础。
53 4