初体验:
感受hanlp的常用功能
例如:命令 hanlp segment
哦豁,出师不利,可以看得出是numpy的问题,csdn查询后,更改numpy版本即可
亲测升级版本并不好使,我该用了numpy==1.14.5成功了
如下图输入案例
(iterhui-hanlp) C:\Users\76709>hanlp segment 商品和服务 商品/n 和/cc 服务/vn 我爱你中国 我/rr 爱/v 你/rr 中国/ns 我是程序员iterhui 我/rr 是/vshi 程序员/nnt iterhui/nx over over/nx
至此,分词体验就结束了,很简单就上手了
下面对文本进行分词尝试
桌面放置了一个中文文档input,完了个犊子…
试了一下,英文不会报错,说明中文有问题,需要处理一下编码问题
这个问题暂时我还没有解决…希望有大佬指点
在Python中尝试一下处理分词
这里我使用了anaconda中的jupyter