建议收藏chatGPT说的Python词云教程

简介: 写在前面这个是当下最流行最时髦的AI神器chatGPT和我一起合作写的一篇通用技术文章,请读者笑纳!Python词云教程介绍Python是一种流行的编程语言,它可以用于许多不同的应用程序,包括数据可视化。其中一个最流行的数据可视化技术是词云。词云是一种可视化技术,可以将文本中出现频率较高的单词呈现为更大的字体,从而突出显示它们的重要性。步骤1:安装所需的库您需要安装一些Python库,以便可以使用词云功能。其中最重要的是wordcloud和matplotlib库。您可以使用以下命令在命令行中安装这些库:pip install wordcloudpip install matpl

写在前面

这个是当下最流行最时髦的AI神器chatGPT和我一起合作写的一篇通用技术文章,请读者笑纳!

Python词云教程

介绍

Python是一种流行的编程语言,它可以用于许多不同的应用程序,包括数据可视化。其中一个最流行的数据可视化技术是词云。词云是一种可视化技术,可以将文本中出现频率较高的单词呈现为更大的字体,从而突出显示它们的重要性。

步骤1:安装所需的库

您需要安装一些Python库,以便可以使用词云功能。其中最重要的是wordcloud和matplotlib库。您可以使用以下命令在命令行中安装这些库:

pip install wordcloud

pip install matplotlib

步骤2:准备文本

在制作词云之前,您需要有一些文本数据。您可以从任何来源获取文本数据,例如:

  • 从文件中读取文本
  • 从API获取文本
  • 从网站中抓取文本

对于这个教程,我们将使用歌词“给你一瓶魔法药水”,例如:

text = """给你一瓶魔法药水


喝下去就不需要氧气


给你一瓶魔法药水


喝下去就不怕身体结冰


轻轻念着你懂的咒语


一扇门就通往银河系


给你一瓶魔法药水


我们一起去太空旅行


宇宙的有趣我才不在意


我在意的是 你牵我的手 而乱跳的心


宇宙的有趣我才不在意


我在意的是 你想跟着我 去月球谈心


拥有你 就不需要魔法给的勇气


轻轻念着你懂的咒语


一扇门就通往银河系


给你一瓶魔法药水


我们一起去太空旅行


宇宙的有趣我才不在意


我在意的是 你牵我的手 而乱跳的心


宇宙的有趣我才不在意


我在意的是 你想跟着我 去月球谈心


宇宙的有趣我才不在意


我在猜的是 前方的距离 几步走到你


宇宙的有趣我才不在意


我期待的是 今天的晚餐 你想吃哪里


拥有你就不需要魔法给的勇气


你走的方向最后到哪去


可能是火星或者是金星


不管多远多近多累都没关系


我的魔法只对你偏心


我偏心


我偏心


宇宙的有趣我才不在意


我在意的是 你牵我的手 而乱跳的心


宇宙的有趣我才不在意


我在意的是 你想跟着我 去月球谈心


宇宙的有趣我才不在意


我在猜的是 奔跑的距离 几步走到你


宇宙的有趣我才不在意


我期待的是 今天的晚餐 你想吃哪里


有你在


就不需要魔法给的勇气

"""

步骤3:生成词云

现在,我们可以使用wordcloud库来生成词云。以下是一个简单的代码示例,可以生成一个基本的词云

from wordcloud import WordCloud

import matplotlib.pyplot as plt


# 设置词云对象

wordcloud = WordCloud(width=800, height=800, background_color='white', stopwords=set(stopwords)).generate(text)


# 绘制词云

plt.figure(figsize=(8, 8), facecolor=None)

plt.imshow(wordcloud)

plt.axis("off")

plt.tight_layout(pad=0)


# 显示词云

plt.show()

在这个代码示例中,我们首先导入了WordCloud和matplotlib.pyplot库。然后,我们创建了一个WordCloud对象,并将其设置为宽度和高度为800像素,背景颜色为白色,并使用停用词集合来过滤文本。接下来,我们使用matplotlib.pyplot库绘制词云,并使用plt.show()命令显示它。

步骤4:调整词云

您可以通过向WordCloud对象提供不同的参数来调整词云的外观。例如,您可以更改字体,字体大小,颜色和形状。以下是一些常用的参数:

  • font_path:指定用于显示文本的字体文件的路径。
  • max_words:指定要包括在词云中的单词的最大数量。
  • colormap:指定用于着色的matplotlib colormap。
  • mask:指定用于词云的形状。
  • 您可以在WordCloud文档中找到完整的参数列表。

下面是一个带有调整的词云示例:

#!/usr/bin/env python

# -*- coding: UTF-8 -*-

from wordcloud import WordCloud

import matplotlib.pyplot as plt

import numpy as np

from PIL import Image


# 歌词文本

text = """给你一瓶魔法药水


喝下去就不需要氧气


给你一瓶魔法药水


喝下去就不怕身体结冰


轻轻念着你懂的咒语


一扇门就通往银河系


给你一瓶魔法药水


我们一起去太空旅行


宇宙的有趣我才不在意


我在意的是 你牵我的手 而乱跳的心


宇宙的有趣我才不在意


我在意的是 你想跟着我 去月球谈心


拥有你 就不需要魔法给的勇气


轻轻念着你懂的咒语


一扇门就通往银河系


给你一瓶魔法药水


我们一起去太空旅行


宇宙的有趣我才不在意


我在意的是 你牵我的手 而乱跳的心


宇宙的有趣我才不在意


我在意的是 你想跟着我 去月球谈心


宇宙的有趣我才不在意


我在猜的是 前方的距离 几步走到你


宇宙的有趣我才不在意


我期待的是 今天的晚餐 你想吃哪里


拥有你就不需要魔法给的勇气


你走的方向最后到哪去


可能是火星或者是金星


不管多远多近多累都没关系


我的魔法只对你偏心


我偏心


我偏心


宇宙的有趣我才不在意


我在意的是 你牵我的手 而乱跳的心


宇宙的有趣我才不在意


我在意的是 你想跟着我 去月球谈心


宇宙的有趣我才不在意


我在猜的是 奔跑的距离 几步走到你


宇宙的有趣我才不在意


我期待的是 今天的晚餐 你想吃哪里


有你在


就不需要魔法给的勇气

"""


# 获取形状

mask = np.array(Image.open('img/3.png'))


# 设置停用词

stopwords = set(["魔法", "宇宙", "有趣", "勇气"])


# 设置词云对象

wordcloud = WordCloud(width=800, height=800, background_color='white', font_path='C:\\Windows\\Fonts\\simsun.ttc', mask=mask, colormap='viridis', stopwords=set(stopwords)).generate(text)


# 绘制词云

plt.figure(figsize=(8, 8), facecolor=None)

plt.imshow(wordcloud)

plt.axis("off")

plt.tight_layout(pad=0)


# 显示词云

plt.show()

在这个代码示例中,我们使用一张docker的鲸鱼图片,然后我们还使用numpy和PIL库来处理形状。我们还设置了一些停用词,以便过滤文本。最后,我们使用WordCloud对象创建了一个词云,并使用mask参数指定了形状。我们还使用colormap参数指定了用于着色的colormap,使用font_path参数指定了字体文件的路径。

FAQ

您好,请问Python中的词云中文乱码怎么解决?

好的,这个问题提的很好。

以Windows为例,到C:\Windows\Fonts找到你想要的字体贴到WordCloud参数里面去,像楼下这样,我贴的是宋体常规,一起来试试吧,或者你也可以改worldcloud的源码,我猜一下应该是它默认的那个字体你电脑上没有导致的。

最后来看下效果吧

总结

这是一个简单的Python词云教程,可以让您开始制作自己的词云。您可以使用wordcloud和matplotlib库来生成基本的词云,并使用不同的参数来调整其外观。您还可以使用numpy和PIL库来处理形状。

以上就是今天的全部内容,希望能够在数据分析、做PPT上面帮到你,再见!

目录
相关文章
|
3月前
|
机器学习/深度学习 数据安全/隐私保护 计算机视觉
过三色刷脸技术,过三色刷脸技术教程,插件过人脸python分享学习
三色刷脸技术是基于RGB三通道分离的人脸特征提取方法,通过分析人脸在不同颜色通道的特征差异
|
3月前
|
XML Linux 区块链
Python提取Word表格数据教程(含.doc/.docx)
本文介绍了使用LibreOffice和python-docx库处理DOC文档表格的方法。首先需安装LibreOffice进行DOC到DOCX的格式转换,然后通过python-docx读取和修改表格数据。文中提供了详细的代码示例,包括格式转换函数、表格读取函数以及修改保存功能。该方法适用于Windows和Linux系统,解决了老旧DOC格式文档的处理难题,为需要处理历史文档的用户提供了实用解决方案。
179 0
|
8月前
|
JSON 数据可视化 API
Python 中调用 DeepSeek-R1 API的方法介绍,图文教程
本教程详细介绍了如何使用 Python 调用 DeepSeek 的 R1 大模型 API,适合编程新手。首先登录 DeepSeek 控制台获取 API Key,安装 Python 和 requests 库后,编写基础调用代码并运行。文末包含常见问题解答和更简单的可视化调用方法,建议收藏备用。 原文链接:[如何使用 Python 调用 DeepSeek-R1 API?](https://apifox.com/apiskills/how-to-call-the-deepseek-r1-api-using-python/)
|
2月前
|
数据采集 索引 Python
Python Slice函数使用教程 - 详解与示例 | Python切片操作指南
Python中的`slice()`函数用于创建切片对象,以便对序列(如列表、字符串、元组)进行高效切片操作。它支持指定起始索引、结束索引和步长,提升代码可读性和灵活性。
|
5月前
|
人工智能 安全 Shell
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程
Jupyter MCP服务器基于模型上下文协议(MCP),实现大型语言模型与Jupyter环境的无缝集成。它通过标准化接口,让AI模型安全访问和操作Jupyter核心组件,如内核、文件系统和终端。本文深入解析其技术架构、功能特性及部署方法。MCP服务器解决了传统AI模型缺乏实时上下文感知的问题,支持代码执行、变量状态获取、文件管理等功能,提升编程效率。同时,严格的权限控制确保了安全性。作为智能化交互工具,Jupyter MCP为动态计算环境与AI模型之间搭建了高效桥梁。
336 2
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程
|
4月前
|
人工智能 搜索推荐 数据可视化
用 Python 制作简单小游戏教程:手把手教你开发猜数字游戏
本教程详细讲解了用Python实现经典猜数字游戏的完整流程,涵盖从基础规则到高级功能的全方位开发。内容包括游戏逻辑设计、输入验证与错误处理、猜测次数统计、难度选择、彩色输出等核心功能,并提供完整代码示例。同时,介绍了开发环境搭建及调试方法,帮助初学者快速上手。最后还提出了图形界面、网络对战、成就系统等扩展方向,鼓励读者自主创新,打造个性化游戏版本。适合Python入门者实践与进阶学习。
348 1
|
4月前
|
存储 算法 数据可视化
用Python开发猜数字游戏:从零开始的手把手教程
猜数字游戏是编程入门经典项目,涵盖变量、循环、条件判断等核心概念。玩家通过输入猜测电脑生成的随机数,程序给出提示直至猜中。项目从基础实现到功能扩展,逐步提升难度,适合各阶段Python学习者。
205 0
|
6月前
|
数据采集 存储 监控
Python 原生爬虫教程:网络爬虫的基本概念和认知
网络爬虫是一种自动抓取互联网信息的程序,广泛应用于搜索引擎、数据采集、新闻聚合和价格监控等领域。其工作流程包括 URL 调度、HTTP 请求、页面下载、解析、数据存储及新 URL 发现。Python 因其丰富的库(如 requests、BeautifulSoup、Scrapy)和简洁语法成为爬虫开发的首选语言。然而,在使用爬虫时需注意法律与道德问题,例如遵守 robots.txt 规则、控制请求频率以及合法使用数据,以确保爬虫技术健康有序发展。
770 31

热门文章

最新文章

推荐镜像

更多