Python:使用pyhanlp 进行分词

简介: Python:使用pyhanlp 进行分词

pyhanlp调用java实现的HanLP接口进行分词

安装

pip install pyhanlp

pyhanlp: https://github.com/hankcs/pyhanlp

HanLP: https://github.com/hankcs/HanLP

代码示例

# -*- coding: utf-8 -*-


from pyhanlp import HanLP

document = "你好,欢迎在Python中调用HanLP的API"

# 分词
print(HanLP.segment(document))
"""
[你好/vl, ,/w, 欢迎/v, 在/p, Python/nx, 中/f, 调用/v, HanLP/nx, 的/ude1, API/nx]
"""

# 关键词提取
print(HanLP.extractKeyword(document, 2))
# [中, 调用]

# 自动摘要
print(HanLP.extractSummary(document, 3))
# [欢迎在Python中调用HanLP的API]


            </div>
目录
相关文章
|
Linux Python Windows
Centos7 下安装python3及卸载
Centos7 下安装python3及卸载
1478 0
Centos7 下安装python3及卸载
|
10月前
|
搜索推荐 物联网 PyTorch
Qwen2.5-7B-Instruct Lora 微调
本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。
10882 34
Qwen2.5-7B-Instruct Lora 微调
Bert可以提取关键词了:KeyBERT的介绍与使用
Bert可以提取关键词了:KeyBERT的介绍与使用
2541 1
Bert可以提取关键词了:KeyBERT的介绍与使用
|
数据采集 存储 人工智能
AI 模型:数据收集和清洗
AI 模型:数据收集和清洗
1109 2
|
机器学习/深度学习 存储 算法
NumPy 与 SciPy:Python 科学计算库的比较
【8月更文挑战第30天】
586 5
|
安全 Ubuntu Linux
在Linux中,如何管理软件包的版本?
在Linux中,如何管理软件包的版本?
|
存储 C语言 数据安全/隐私保护
C语言实现简易银行账户管理系统
C语言实现简易银行账户管理系统
547 1
|
数据处理 数据库 流计算
Flink-CDC 的性能与许多因素有关
【1月更文挑战第23天】【1月更文挑战第114篇】Flink-CDC 的性能与许多因素有关
255 6
|
存储 消息中间件 分布式计算
大数据集群资源预估规划【适用于面试与工作集群规划】
大数据集群资源预估规划【适用于面试与工作集群规划】
826 0
大数据集群资源预估规划【适用于面试与工作集群规划】
|
关系型数据库 MySQL 数据库
mysql:添加时间列自动更新时间(用于记录创建时间和修改时间)
mysql:添加时间列自动更新时间(用于记录创建时间和修改时间)
1394 0
mysql:添加时间列自动更新时间(用于记录创建时间和修改时间)