Python:使用nltk统计词频并绘制统计图

简介: Python:使用nltk统计词频并绘制统计图

测试环境:

mac

python3.6.5

安装

pip install nltk

代码示例

# -*- coding: utf-8 -*-


from nltk import FreqDist
from matplotlib import rcParams

# matplotlib 设置中文字体
rcParams["font.family"] = "STHeiti"
rcParams["font.size"] = 8


words = ["你好", "你好", "我好", "我还有"]

freq = FreqDist(words)
print(freq.most_common(1)) # [('你好', 2)]
print(freq.freq("你好")) # 频率 0.5
print(freq["你好"]) # 次数 2

freq.tabulate() # 频率分布表

freq.plot() # 频率分布图

d21.1.png

            </div>
目录
相关文章
|
监控 Python
logging的基本使用教程
这篇文章提供了Python `logging` 模块的基本使用教程,包括如何配置日志级别和格式、记录不同级别的日志消息,以及如何将日志输出到文件。
|
存储 Java 程序员
100道最新Java面试题,常见面试题及答案汇总(上)
100道最新Java面试题,常见面试题及答案汇总
381 0
|
人工智能 IDE 测试技术
人工智能 | 结对编程助手GithubCopilot
GitHub Copilot 是一款人工智能编码助手,能够加速您的编程流程。它根据上下文即时提供建议,无论是单行代码还是完整函数。Copilot 由 GitHub、OpenAI 和 Microsoft 联合开发,可在多种 IDE(如 Visual Studio Code、JetBrains IDEs)中使用。只需在 IDE 中安装扩展并激活服务,即可享受智能代码补全功能。虽然 Copilot 有助于提升开发效率,但也需用户审慎检查其提供的建议以确保准确性。试用结束后,记得管理订阅以免产生不必要的费用。
人工智能 | 结对编程助手GithubCopilot
|
安全 网络安全 数据安全/隐私保护
|
缓存 JavaScript 前端开发
前端10种火火火火的优化代码性能方法!避免代码跑起来像蜗牛!
前端10种火火火火的优化代码性能方法!避免代码跑起来像蜗牛!
|
存储 弹性计算 移动开发
无影云电脑快速上手教程(保姆级)
无影云电脑快速上手教程(保姆级)阿里云无影云桌面即无影云电脑,云电脑如何使用?云电脑购买后没有用户名和密码,先创建用户设置密码,才可以登录连接到云电脑。云电脑想要访问公网还需要开通互联网访问功能。阿里云百科来详细说下阿里云无影云电脑从购买、创建用户名密码和访问互联网全过程
625 1
|
Oracle 安全 关系型数据库
Linux下HugePage内存功能配置
  在Linux环境性能优化实践中,HugePage是一个经常提到的方法。简单的说,HugePage就是Linux内核上一种是用内存块的方法。作为传统4K Page的替代,HugePage在大部分场景下可以提升Oracle实例的运行性能效率。
1388 0
|
存储 缓存 Rust
深入浅出 tnpm rapid 模式 - 如何比 pnpm 快 10 秒
深入浅出 tnpm rapid 模式 - 如何比 pnpm 快 10 秒
527 1
|
弹性计算 供应链 固态存储
阿里云GPU服务器租用费用一年价格及GPU配置计费模式说明
阿里云GPU服务器配置及租用费用价格表,阿里云GPU云服务器计费模式分为包年包月、按量付费和抢占式实例
3782 0
阿里云GPU服务器租用费用一年价格及GPU配置计费模式说明
|
传感器 编解码
ENVI:如何进行图像融合?
ENVI:如何进行图像融合?
688 0