自然语言处理hanlp------2初体验

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: 自然语言处理hanlp------2初体验

初体验:

感受hanlp的常用功能

例如:命令 hanlp segment

20201219135734240.png


哦豁,出师不利,可以看得出是numpy的问题,csdn查询后,更改numpy版本即可

亲测升级版本并不好使,我该用了numpy==1.14.5成功了

如下图输入案例

(iterhui-hanlp) C:\Users\76709>hanlp segment
商品和服务
商品/n 和/cc 服务/vn
我爱你中国
我/rr 爱/v 你/rr 中国/ns
我是程序员iterhui
我/rr 是/vshi 程序员/nnt iterhui/nx
over
over/nx

20201219140220237.png

20201219140508158.png

至此,分词体验就结束了,很简单就上手了

下面对文本进行分词尝试


桌面放置了一个中文文档input,完了个犊子…

试了一下,英文不会报错,说明中文有问题,需要处理一下编码问题

这个问题暂时我还没有解决…希望有大佬指点

20201219143122466.png


在Python中尝试一下处理分词

这里我使用了anaconda中的jupyter

20201219151420427.png

2020121915145120.png





相关文章
|
存储 缓存 NoSQL
gossip:借助流言蜚语实现数据一致性
gossip:借助流言蜚语实现数据一致性
258 11
|
存储 缓存 关系型数据库
如何优化大表的查询速度?
本文介绍了优化大数据表查询速度的方法。关键点包括:1) 创建索引以加快查询;2) 优化查询语句,避免全表扫描;3) 使用缓存来提高查询效率,利用内存访问速度快和IO操作少的优势;4) 提升硬件配置,如使用固态硬盘和增加内存;5) 数据归档和分离,减少主表数据量;6) 实施数据库分片,如分库分表技术,以分散数据并提高并发性能。分库分表包括只分库、只分表(横向和纵向)以及两者结合,常见的分库分表中间件有ShardingSphere、MyCAT、TDDL和Vitess。这些策略通常结合使用,以应对大数据量查询的挑战。
846 1
|
11月前
|
安全
服务器数据恢复—逻辑卷管理(LVM)数据恢复案例
服务器数据恢复环境: 两组分别由4块SAS硬盘组建的raid5阵列,两组阵列划分的LUN组成LVM架构,格式化为EXT3文件系统。 服务器故障: 一组raid5阵列中的一块硬盘离线。热备盘自动上线替换离线硬盘,但在热备盘上线同步数据的过程中,又有一块硬盘离线,导致热备盘同步失败。该组raid阵列崩溃,LVM结构不完整,文件系统无法正常使用。 将2块离线硬盘做好标记后取出&进行检测,发现先离线的硬盘无法识别,初步判断该硬盘出现硬件故障,需要开盘修复,另一块离线硬盘可以识别。
|
Ubuntu 持续交付 API
如何使用 dotnet pack 打包 .NET 跨平台程序集?
`dotnet pack` 是 .NET Core 的 NuGet 包打包工具,用于将代码打包成 NuGet 包。通过命令 `dotnet pack` 可生成 `.nupkg` 文件。使用 `--include-symbols` 和 `--include-source` 选项可分别创建包含调试符号和源文件的包。默认情况下,`dotnet pack` 会先构建项目,可通过 `--no-build` 跳过构建。此外,还可以使用 `--output` 指定输出目录、`-c` 设置配置等。示例展示了创建类库项目并打包的过程。更多详情及命令选项,请参考官方文档。
689 13
|
12月前
|
JavaScript 前端开发
vue插件-less、less-loader样式管理
vue插件-less、less-loader样式管理
112 0
|
安全 网络安全 数据安全/隐私保护
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享安卓与iOS开发中的线程管理比较
【8月更文挑战第30天】本文将探讨网络安全与信息安全的重要性,并分享关于网络安全漏洞、加密技术和安全意识的知识。我们将了解常见的网络攻击类型和防御策略,以及如何通过加密技术和提高安全意识来保护个人和组织的信息安全。
|
存储 NoSQL JavaScript
mongodb时间处理,时区处理
mongodb时间处理,时区处理
3462 2
|
小程序
基于微信小程序的电器维修系统设计与实现(源码+lw+部署文档+讲解等)
基于微信小程序的电器维修系统设计与实现(源码+lw+部署文档+讲解等)
270 0
基于微信小程序的电器维修系统设计与实现(源码+lw+部署文档+讲解等)
|
小程序 前端开发 UED
微信小程序进行分包加载
微信小程序进行分包加载
449 0
|
机器学习/深度学习 自然语言处理 Serverless
NLP / LLMs中的Temperature 是什么?
ChatGPT, GPT-3, GPT-3.5, GPT-4, LLaMA, Bard等大型语言模型的一个重要的超参数
3616 0
NLP / LLMs中的Temperature 是什么?