Python:使用nltk统计词频并绘制统计图

简介: Python:使用nltk统计词频并绘制统计图

测试环境:

mac

python3.6.5

安装

pip install nltk

代码示例

# -*- coding: utf-8 -*-


from nltk import FreqDist
from matplotlib import rcParams

# matplotlib 设置中文字体
rcParams["font.family"] = "STHeiti"
rcParams["font.size"] = 8


words = ["你好", "你好", "我好", "我还有"]

freq = FreqDist(words)
print(freq.most_common(1)) # [('你好', 2)]
print(freq.freq("你好")) # 频率 0.5
print(freq["你好"]) # 次数 2

freq.tabulate() # 频率分布表

freq.plot() # 频率分布图

d21.1.png

            </div>
目录
相关文章
|
数据可视化 数据挖掘 数据处理
【100天精通Python】Day61:Python 数据分析_Pandas可视化功能:绘制饼图,箱线图,散点图,散点图矩阵,热力图,面积图等(示例+代码)
【100天精通Python】Day61:Python 数据分析_Pandas可视化功能:绘制饼图,箱线图,散点图,散点图矩阵,热力图,面积图等(示例+代码)
513 0
|
5月前
|
数据采集 自然语言处理 搜索推荐
python【包含数据预处理】基于词频生成词云图
背景目的 有一篇中文文章,或者一本小说。想要根据词频来生成词云图。
|
5月前
|
数据采集 自然语言处理 搜索推荐
python 【包含数据预处理】基于词频生成词云图
这段文本是关于如何使用Python基于词频生成词云图的教程。内容包括:1) 中文分词的必要性,因中文无明显单词边界及语言单位特性;2) 文本预处理步骤,如移除特殊符号、网址、日期等;3) 使用`data_process`函数清除无用字符;4) `getText`函数读取并处理文本为句子数组;5) 使用jieba分词库进行分词和词频统计;6) 示例代码展示了从分词到生成词云的完整流程,最后展示生成的词云图。整个过程旨在从中文文本中提取关键词并可视化。
147 5
python 【包含数据预处理】基于词频生成词云图
|
6月前
|
机器学习/深度学习 自然语言处理 数据可视化
用Python分析文本数据的词频并词云图可视化
用Python分析文本数据的词频并词云图可视化
183 0
|
5月前
|
Python
图片相似度比较_python
图片相似度比较_python
50 1
|
6月前
|
Python
python绘制词云图
python绘制词云图
72 0
|
自然语言处理 搜索推荐 Python
使用python读取word统计词频并生成词云
使用python读取word统计词频并生成词云
170 0
|
测试技术 Python
Python:使用nltk统计词频并绘制统计图
Python:使用nltk统计词频并绘制统计图
109 0
Python:使用nltk统计词频并绘制统计图
|
数据可视化 数据挖掘 Python
跟着PNAS学作图:R语言ggplot2作图展示多序列比对结果
跟着PNAS学作图:R语言ggplot2作图展示多序列比对结果
python小玩意——词频展示和统计
python小玩意——词频展示和统计
python小玩意——词频展示和统计
下一篇
无影云桌面