Python下中科院NLPIR(ICTCLAS2014)分词软件的安装与使用

简介:     ICTCLAS是张华平博士的杰作,在多版演进后,于2014年释出的新版本,当然新版改名叫做NLPIR了,支持中英文分词,词性标注,关键语义提取,微博分词,修缮了部分bug,非商用永久免费。

    
ICTCLAS是 张华平博士的杰作,在多版演进后,于2014年释出的新版本,当然新版改名叫做NLPIR了, 支持中英文分词,词性标注,关键语义提取,微博分词, 修缮了部分bug,非商用永久免费。其中,对C/C++/C#/JAVA语言的支持 都已非常完善,但我用的是Pytho n,之前选择的是 SCWS组件,但在实际使用过程中感觉 SCWS分词和词性标注 质量并不如 NLPIR好,因此打算换用NLPIR。

   第一个问题是如何安装NLPIR。由于NLPIR需要首先安装swig我首先试了“easy_install swig”和“pip install swig”都失败了。然后登陆swig官网,下载win32的包。
    sourceforege上的地址如下:
http://sourceforge.net/projects/swig/files/swigwin/swigwin-3.0.0/swigwin-3.0.0.zip/download?use_mirror=ncu


   下载后解压到C:\Program Files\swigwin,并在系统path中添加这一路径。
   快捷键win+r
cmd命令后 开命令行窗口,输入swig,出现“Must specify an input file. Use -help for available options.”,说明swig已安装成功。如下图所示:



      
接下来,就需要下载安装我们的主角NLPIR了。
     虽然可以简单地从微盘下载,如这里:


     但运气不佳,我现在访问微盘时,正好赶上“扫黄打非”,而看不到他人的共享文件:

      所以,我就去GitHub上下载。
     打开浏览器,进入
https://github.com/killuahzl/python-nlpir
     在下图所示位置,下载zip包。


    未完待续。。。
相关文章
|
18天前
|
NoSQL MongoDB Python
【Python】已完美解决(MongoDB安装报错)Service ‘MongoDB Server (MongoDB)’ (MongoDB) failed tostart
【Python】已完美解决(MongoDB安装报错)Service ‘MongoDB Server (MongoDB)’ (MongoDB) failed tostart
21 1
|
4天前
|
机器学习/深度学习 Ubuntu 数据挖掘
在Ubuntu系统安装Anaconda及Python
【7月更文挑战第10天】在Ubuntu上安装Anaconda及Python概述: 1. 访问官网下载适合的Anaconda版本。 2. 终端中运行`bash Anaconda3-xxxx.x-Linux-x86_64.sh`完成安装,需同意协议。 3. 通过`conda --version`验证安装。 4. 可选创建Python环境,如`conda create -n myenv python=3.8`。 5. 激活环境使用`conda activate myenv`。 6. 用`python --version`检查Python版本。
|
13天前
|
开发者 Python
确保你的Python环境中已经安装了`python-docx`模块。如果还没有安装,可以通过pip来安装:
确保你的Python环境中已经安装了`python-docx`模块。如果还没有安装,可以通过pip来安装:
|
23天前
|
JSON 数据格式 Python
Flask实现内部接口----pycharm安装及新建,location代表着文件路径,下面是Python的环境,Flask是由Python开发的框架,Python文件接口ython通过GET发送
Flask实现内部接口----pycharm安装及新建,location代表着文件路径,下面是Python的环境,Flask是由Python开发的框架,Python文件接口ython通过GET发送
|
17天前
|
自然语言处理 安全 Shell
【Python】已解决:Python pip正确安装pyhanlp库步骤
【Python】已解决:Python pip正确安装pyhanlp库步骤
19 2
|
23天前
|
Python
|
17天前
|
开发者 Python
【Python】已解决:(Python3中pip无法安装urllib报错问题) ERROR: Could not find a version that satisfies the requireme
【Python】已解决:(Python3中pip无法安装urllib报错问题) ERROR: Could not find a version that satisfies the requireme
29 0
【Python】已解决:(Python3中pip无法安装urllib报错问题) ERROR: Could not find a version that satisfies the requireme
|
18天前
|
Ubuntu 编译器 Python
【Python】已解决:安装python-Levenshtein包时遇到的subprocess-exited-with-error问题
【Python】已解决:安装python-Levenshtein包时遇到的subprocess-exited-with-error问题
22 1
|
23天前
|
达摩院 语音技术 异构计算
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
|
9天前
|
运维 DataWorks 安全
DataWorks产品使用合集之如何在本地环境中安装Python包
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。