Python | 数据挖掘,WordCloud词云配置过程及词频分析

简介: 一. 安装WordCloud 在使用WordCloud词云之前,需要使用pip安装相应的包。 pip install WordCloud pip install jieba 其中WordCloud是词云,jieba是结巴分词工具。
一. 安装WordCloud
在使用WordCloud词云之前,需要使用pip安装相应的包。
  pip install WordCloud     

  pip install jieba
其中WordCloud是词云,jieba是结巴分词工具。
问题:在安装WordCloud过程中,你可能遇到的第一个错误如下。
error: Microsoft Visual C++ 9.0 is required. Get it from http://asa.ms/vcpython27
7a9d07709c743bdcdf9154a0afff67378812f753
解决方法也很简单,下载VCForPython27安装(Microsoft Visual C++ Compiler for Python 2.7)。但是在微软下载总是没响应。
这是最大的问题,下面我自己提供一个CSDN的地址供大家下载。下载完成,可以进行安装响应的库函数。
资源地址:
http://download.csdn.net/detail/eastmount/9788218
baeaea04beee93f162c18c7a07a26443e11c86b5
安装完成之后,可以正常运行代码啦。
二. 简单词云代码
下面这部分代码参考老曹的,希望对你有所帮助。
老曹说:什么是词云呢?词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。
代码如下:
a6344de52204fc7e72a0dfa70c0e3ae96f3ed24c
这是中文编码问题,下面讲解解决方法。
三. 中文编码错误及解决
在WordCloud安装的目录下找到WordCloud.py文件,对源码进行修改。
ca2cd87bdd8ad59870289ca618e682ebf02ec399
注意,此时运行代码还是报错,因为需要在同一个目录下放置msyh.ttf字体文件供程序调用,如下图所示,这是原来的字体DroidSansMono.ttf。
6ec36bc9060dc7863bab7672a3f205a016faf68f
也可以采用下面的代码:
 wordcloud = WordCloud(font_path = 'MSYH.TTF').fit_words(word)
四. 照片背景的词云代码
下面进一步深入,假设存在一个图 "sss3.png",核心代码如下:
6c1682a0c4e2686d9985dc68e9590897bf2f50d7
原文发布时间为:2018-09-18
本文作者: 上海小胖
本文来自云栖社区合作伙伴“ Python专栏”,了解相关信息可以关注“ Python专栏”。

相关文章
|
23小时前
|
存储 IDE Linux
Python零基础入门-0 Python简介和开发环境PyCharm配置
Python零基础入门-0 Python简介和开发环境PyCharm配置
|
2天前
|
XML 数据格式 Python
Python使用xpath对解析内容进行数据提取
在前面的文章当中,已经教大家如何去获取我们需要的数据原文内容,今天就介绍一个用于提取所需数据的方法之一xpath。在后续会讲解bs4(beautifulsoup),re正则表达式。
|
2天前
|
存储 JSON JavaScript
使用Python处理JSON格式数据
使用Python处理JSON格式数据
|
2天前
|
JSON 数据格式 Python
python3 服务端使用CGI脚本处理POST的Json数据
python3 服务端使用CGI脚本处理POST的Json数据
20 6
|
3天前
|
存储 XML 数据处理
Python网络实践:去哪儿旅游数据爬取指南
Python网络实践:去哪儿旅游数据爬取指南
|
3天前
|
关系型数据库 MySQL API
用Python一键艺龙酒店各个城市数据存入mysql
用Python一键艺龙酒店各个城市数据存入mysql
|
5天前
|
分布式计算 大数据 MaxCompute
MaxCompute产品使用合集之在Python SDK中,可以使用什么往表中写入数据
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
5天前
|
SQL 供应链 数据可视化
python可视化练习:一家运动服装品牌销售数据的可视化改进案例研究
python可视化练习:一家运动服装品牌销售数据的可视化改进案例研究
|
8天前
|
存储 Python
Python3 数据类型详解:掌握数据基石,编写高效程序
Python3 数据类型详解:掌握数据基石,编写高效程序
|
8天前
|
存储 算法 数据处理
掌握Python列表:灵活存储、便捷操作,轻松处理各类数据
掌握Python列表:灵活存储、便捷操作,轻松处理各类数据