自然语言处理hanlp------2初体验

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 自然语言处理hanlp------2初体验

初体验:

感受hanlp的常用功能

例如:命令 hanlp segment

20201219135734240.png


哦豁,出师不利,可以看得出是numpy的问题,csdn查询后,更改numpy版本即可

亲测升级版本并不好使,我该用了numpy==1.14.5成功了

如下图输入案例

(iterhui-hanlp) C:\Users\76709>hanlp segment
商品和服务
商品/n 和/cc 服务/vn
我爱你中国
我/rr 爱/v 你/rr 中国/ns
我是程序员iterhui
我/rr 是/vshi 程序员/nnt iterhui/nx
over
over/nx

20201219140220237.png

20201219140508158.png

至此,分词体验就结束了,很简单就上手了

下面对文本进行分词尝试


桌面放置了一个中文文档input,完了个犊子…

试了一下,英文不会报错,说明中文有问题,需要处理一下编码问题

这个问题暂时我还没有解决…希望有大佬指点

20201219143122466.png


在Python中尝试一下处理分词

这里我使用了anaconda中的jupyter

20201219151420427.png

2020121915145120.png





相关文章
|
缓存 Java 应用服务中间件
一文带你使用xxl-job定时任务
将调度行为抽象形成“调度中心”公共平台,而平台自身并不承担业务逻辑,“调度中心”负责发起调度请求。 将任务抽象成分散的JobHandler,交由“执行器”统一管理,“执行器”负责接收调度请求并执行对应的JobHandler中业务逻辑。 因此,“调度”和“任务”两部分可以相互解耦,提高系统整体稳定性和扩展性;
4851 0
一文带你使用xxl-job定时任务
|
存储 缓存 关系型数据库
如何优化大表的查询速度?
本文介绍了优化大数据表查询速度的方法。关键点包括:1) 创建索引以加快查询;2) 优化查询语句,避免全表扫描;3) 使用缓存来提高查询效率,利用内存访问速度快和IO操作少的优势;4) 提升硬件配置,如使用固态硬盘和增加内存;5) 数据归档和分离,减少主表数据量;6) 实施数据库分片,如分库分表技术,以分散数据并提高并发性能。分库分表包括只分库、只分表(横向和纵向)以及两者结合,常见的分库分表中间件有ShardingSphere、MyCAT、TDDL和Vitess。这些策略通常结合使用,以应对大数据量查询的挑战。
927 1
|
Ubuntu 持续交付 API
如何使用 dotnet pack 打包 .NET 跨平台程序集?
`dotnet pack` 是 .NET Core 的 NuGet 包打包工具,用于将代码打包成 NuGet 包。通过命令 `dotnet pack` 可生成 `.nupkg` 文件。使用 `--include-symbols` 和 `--include-source` 选项可分别创建包含调试符号和源文件的包。默认情况下,`dotnet pack` 会先构建项目,可通过 `--no-build` 跳过构建。此外,还可以使用 `--output` 指定输出目录、`-c` 设置配置等。示例展示了创建类库项目并打包的过程。更多详情及命令选项,请参考官方文档。
783 12
|
安全
服务器数据恢复—逻辑卷管理(LVM)数据恢复案例
服务器数据恢复环境: 两组分别由4块SAS硬盘组建的raid5阵列,两组阵列划分的LUN组成LVM架构,格式化为EXT3文件系统。 服务器故障: 一组raid5阵列中的一块硬盘离线。热备盘自动上线替换离线硬盘,但在热备盘上线同步数据的过程中,又有一块硬盘离线,导致热备盘同步失败。该组raid阵列崩溃,LVM结构不完整,文件系统无法正常使用。 将2块离线硬盘做好标记后取出&进行检测,发现先离线的硬盘无法识别,初步判断该硬盘出现硬件故障,需要开盘修复,另一块离线硬盘可以识别。
|
小程序
基于微信小程序的电器维修系统设计与实现(源码+lw+部署文档+讲解等)
基于微信小程序的电器维修系统设计与实现(源码+lw+部署文档+讲解等)
317 0
基于微信小程序的电器维修系统设计与实现(源码+lw+部署文档+讲解等)
|
SQL Java 关系型数据库
SpringBoot 系列之 MyBatis输出SQL日志
这篇文章介绍了如何在SpringBoot项目中通过MyBatis配置输出SQL日志,具体方法是在`application.yml`或`application.properties`中设置MyBatis的日志实现为`org.apache.ibatis.logging.stdout.StdOutImpl`来直接在控制台打印SQL日志。
SpringBoot 系列之 MyBatis输出SQL日志
|
JavaScript 前端开发
vue插件-less、less-loader样式管理
vue插件-less、less-loader样式管理
167 0
|
小程序 前端开发 UED
微信小程序进行分包加载
微信小程序进行分包加载
492 0
|
自然语言处理
自然语言处理hanlp------3java调用hanlp
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
自然语言处理hanlp------3java调用hanlp
|
数据采集 自然语言处理 算法
java应用集成HanLP进行中文自然语言分词详细完整案例以及demo源码
java应用集成HanLP进行中文自然语言分词详细完整案例以及demo源码
51823 1
java应用集成HanLP进行中文自然语言分词详细完整案例以及demo源码