spacy包及trained pipelines安装教程

简介: spacy是自然语言处理中常用的Python包,本文介绍spacy包及其配套语言包的安装方式。

spacy官网:spaCy · Industrial-strength Natural Language Processing in Python

spacy官网安装教程:Install spaCy · spaCy Usage Documentation


可以根据自己的系统等要求来进行选择:

image.png

① 这里的cuda版本可以选anaconda环境中cudatoolit对应的版本,如TensorFlow2.9.0版本会要求安装cuda11.2(可参考我之前写过的博文TensorFlow安装教程),就可以选cuda11.2

② virtual env选项是用virtualenv包来实现Python虚拟环境的管理,创建虚拟环境并在指定虚拟环境下安装spacy包,我用anaconda,所以不用。

③ trained pipelines不用代理很难直接下载,因此我建议不要在这一步选择,我会在后面介绍这些trained pipeline的离线安装方式。

④ 3.3版本spacy似乎需要一个3.8版本以上Python才有的内置库,因此需要3.8版本以上的Python编辑器。(官网说Python版本大于3.6即可,嘛,我之前跑3.2版本的时候确实也可以用3.7.2版本的Python来跑,但是更新到3.8版本的Python更是绝对没问题的了)

这里直接给出的命令是:

pip install -U pip setuptools wheel
pip install -U 'spacy[cuda112]'


使用该命令即可成功安装spacy包。

安装trained_pipelines的方法:

官网:Trained Models & Pipelines · spaCy Models Documentation

方法一:直接使用官网提供的命令安装,如安装英文pipeline,就根据官网进行选择,然后直接安装(这两种loading style本质上差不多),能直接下的话就能直接用了:

image.png

如果因为众所周知的网络原因无法下载,请看方法二。


方法二:可以在Releases · explosion/spacy-models里面直接找需要下载的压缩文件,如我需要下en_core_web_sm,则直接搜索即可:

image.png

下载tar.gz或者whl都可以,我下的是tar.gz文件。

直接调用pip install spacy_model/en_core_web_sm-3.3.0.tar.gz命令即可。

(注意:model的版本需要和spacy的版本对应,如果不对应会强制更新spacy的版本。如我下载了3.3版本的spacy,但是我pip install了3.2版本的en_core_web_sm,就会自动重新安装3.2版本的spacy:

image.png

(后面的输出略))

相关文章
|
缓存 API 数据库
Py之lmdb:lmdb的简介、安装、使用方法之详细攻略
Py之lmdb:lmdb的简介、安装、使用方法之详细攻略
Py之lmdb:lmdb的简介、安装、使用方法之详细攻略
|
2月前
|
编译器 Linux TensorFlow
【Deepin 20系统】Tensorflow2.x离线下载cifar-10-python.tar.gz如何配置使用cifar10.load_data()
文章讨论了在Deepin 20系统上使用Tensorflow 2.x时,如何通过离线方式配置使用CIFAR-10数据集。
36 0
|
5月前
|
计算机视觉
这是一个关于face_recognition和dlib库的安装(亲测有用,毕竟我代码都写出来了)
这是一个关于face_recognition和dlib库的安装(亲测有用,毕竟我代码都写出来了)
|
5月前
|
API 计算机视觉 Docker
ModelScope问题之安装mmcv报错如何解决
本合集将提供ModelScope安装步骤、配置要求和环境准备,以便用户顺利启动ModelScope进行模型开发和测试。
325 2
|
Java Linux Shell
centos7内网离线安装face_recognition、python、pip、CMake、dlib,离线升级gcc/切换gcc,文末有face_recognition的docker版本
公司项目需要人脸识别,本来app自带人脸识别,结果api支持的设备试了一圈就一个同事的华为Mate40Pro可以,所以使用无望。接着找了一下免费的java离线人脸识别sdk,发现虹软的确实简单好用,一会就在linux上弄好并测试通过了,然而在准备集成进去开写代码时,不小心看到了一眼首次激活需联网,后续方可离线使用,好吧,我们内网机器首次都不可能的,接着看了下离线激活方法,首先需要企业认证,这一步我们肯定没法做的,毕竟不是之前的小公司了,营业执照啥的随便给我肯定不行,直接放弃了。后来在同事推荐下看了下face_recognition这个项目,之前基本没用过python,于是有了漫长的踩坑之旅。
629 1
|
机器学习/深度学习 人工智能 Linux
Linux和Windows系统下安装深度学习框架所需支持:Anaconda、Paddlepaddle、Paddlenlp、pytorch,含GPU、CPU版本详细安装过程
Linux和Windows系统下安装深度学习框架所需支持:Anaconda、Paddlepaddle、Paddlenlp、pytorch,含GPU、CPU版本详细安装过程
Linux和Windows系统下安装深度学习框架所需支持:Anaconda、Paddlepaddle、Paddlenlp、pytorch,含GPU、CPU版本详细安装过程
|
TensorFlow 算法框架/工具 Python
tensorflow安装错误:Could not find a version that satisfies the requirement tensorflow 解决
tensorflow安装错误:Could not find a version that satisfies the requirement tensorflow 解决
【YOLOV5-6.x讲解】DIY实验文件 models/experimental.py
【YOLOV5-6.x讲解】DIY实验文件 models/experimental.py
229 0
|
Python
YOLOv5的Tricks | 【Trick13】YOLOv5的detect.py脚本的解析与简化
YOLOv5的Tricks | 【Trick13】YOLOv5的detect.py脚本的解析与简化
1442 0
YOLOv5的Tricks | 【Trick13】YOLOv5的detect.py脚本的解析与简化
|
并行计算 PyTorch 算法框架/工具
PyTorch Geometric (PyG) 安装教程
以下根据PyTorch和对应的cuda版本来写PyG的安装方式。对应可行的安装时间会对应附上。 由于我在遇到对应情况时才能撰写对应博文,更多情况看以后我会不会遇上吧。
PyTorch Geometric (PyG) 安装教程
下一篇
无影云桌面