Py之nltk:nltk包的简介、安装、使用方法、代码实现之详细攻略

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: Py之nltk:nltk包的简介、安装、使用方法、代码实现之详细攻略

nltk包的简介


      NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, wrappers for industrial-strength NLP libraries, and an active discussion forum.


      NLTK是构建用于处理人类语言数据的Python程序的领先平台。它为超过50个语料库和词汇资源(如WordNet)提供了易于使用的界面,以及一套用于分类、标记化技术、词干、标记、解析和语义推理的文本处理库、工业级NLP库的包装器以及一个活跃的讨论论坛。


      用Python进行自然语言处理为语言处理的编程提供了一个实用的介绍。它由NLTK的创建者编写,指导读者完成编写python程序、使用语料库、对文本进行分类、分析语言结构等的基础知识。这本书的在线版本已经为python 3和nltk 3进行了更新。


     自然语言工具包(NLTK)是用于自然语言处理的Python包。NLTK需要python 2.7、3.4、3.5、3.6或3.7。


     NLTK(Natural Language ToolKit),是时下非常流行的在Python解释器环境中用于自然语言处理的工具包。对于NLTK的使用者而言,它就像是一名极其高效的语言学家,为您快速完成对自然语言文本的深层处理和分析。


Natural Language Toolkit官网

nltk Package API




nltk包的安装


pip install nltk

image.png




nltk包的使用方法


from nltk.corpus import treebank

t = treebank.parsed_sents('wsj_0001.mrg')[0]

t.draw()


image.png


nltk包的代码实现


import nltk

sentence = """At eight o'clock on Thursday morning

tokens = nltk.word_tokenize(sentence)

print(tokens)

tagged = nltk.pos_tag(tokens)

print(tagged )



相关文章
|
9月前
|
存储 计算机视觉 Python
搭建Python-OpenCV开发环境(包括Python、Pycharm、OpenCV下载 图文解释)
搭建Python-OpenCV开发环境(包括Python、Pycharm、OpenCV下载 图文解释)
982 0
|
机器学习/深度学习 算法 安全
Py之dlib:Python库之dlib库的简介、安装、使用方法详细攻略(一)
Py之dlib:Python库之dlib库的简介、安装、使用方法详细攻略
Py之dlib:Python库之dlib库的简介、安装、使用方法详细攻略(一)
|
5月前
|
Python
用python进行视频剪辑源码
这篇文章提供了一个使用Python进行视频剪辑的源码示例,通过结合moviepy和pydub库来实现视频的区间切割和音频合并。
117 2
|
9月前
|
存储 机器学习/深度学习 数据安全/隐私保护
最全Pillow(PIL)入门教程(非常详细)_python pillow 教程,2024年最新Python面试送分题
最全Pillow(PIL)入门教程(非常详细)_python pillow 教程,2024年最新Python面试送分题
|
9月前
|
Shell Python
Python生成PDF文件
Python生成PDF文件
207 0
|
Python
Python | 下载你的小说
没网的时候想看小说,咱就只能下载下来,那咱从《笔趣阁》上面扒一扒吧
158 0
|
Python
Python3.6.3安装详细简单完整版
Python3.6.3安装详细简单完整版
768 0
Python3.6.3安装详细简单完整版
|
数据挖掘 数据安全/隐私保护 计算机视觉
PyPDF2:使用Python操作PDF文件
PDF是文档常用格式,使用Python包PyPDF2可以对PDF文档实现批量、迅速的操作,包括提取文字、切分或合并PDF文件、创建annotation、加密和解密等。本文将介绍PyPDF2包的安装及简单使用方式。 PyPDF的GitHub项目官网:py-pdf/PyPDF2: A pure-python PDF library capable of splitting, merging, cropping, and transforming the pages of PDF files
PyPDF2:使用Python操作PDF文件
|
机器学习/深度学习 Python 容器
一篇文章掌握 Python 内置 zip() 的全部内容
zip() 是 Python 中最好用的内置类型之一,它可以接收多个可迭代对象参数,再返回一个迭代器,可以把不同可迭代对象的元素组合起来。 内容主要分三部分: • 用法部分:介绍它的基础用法、高级用法、骚操作用法 • 进阶部分:介绍它的实现原理,关注几个实现的细节 • 发散部分:聚焦它的不足,以及解决方法
190 0
一篇文章掌握 Python 内置 zip() 的全部内容

热门文章

最新文章