hanlp添加自定义字典的步骤介绍

简介: 本篇分享一个hanlp添加自定义字典的方法,供大家参考!总共分为两步:第一步:将自定义的字典放到custom目录下,然后删除CustomDicionary.txt.bin,因为分词的时候会读这个文件。

本篇分享一个hanlp添加自定义字典的方法,供大家参考!
总共分为两步:
第一步:将自定义的字典放到custom目录下,然后删除CustomDicionary.txt.bin,因为分词的时候会读这个文件。如果没有的话它会根据配置文件中路径去加载字典生成bin文件。
_1

第二步:去配置文件把自己添加自定义的文件的路径添加进去,注意一定要添加末尾后面而且结束时不能有;号,我添加在其他位置都不好使。而且相对路径也不好使
_2

上面是把bin文件删掉后跑起来的样子,会等一两分钟生成bin文件。

相关文章
|
1月前
|
存储 自然语言处理 数据库
Python字典操作实现文章敏感词检索
Python字典操作实现文章敏感词检索
|
6月前
|
存储 自然语言处理
QT案例词典 -- 存储内容及遍历
QT案例词典 -- 存储内容及遍历
48 1
|
6月前
|
PHP Python
基于Python中docx与docxcompose批量合并多个Word文档文件并逐一添加分页符
基于Python中docx与docxcompose批量合并多个Word文档文件并逐一添加分页符
193 1
|
自然语言处理 搜索推荐 Python
jieba分词器(应用及字典的补充)及文档高频词提取实战
jieba分词器(应用及字典的补充)及文档高频词提取实战
|
Python
一日一技:在Python中合并字典模块ChainMap的隐藏坑
一日一技:在Python中合并字典模块ChainMap的隐藏坑
85 0
|
Python
python批量默认初始化与获取字典,fromkeys方法和get方法
python批量默认初始化与获取字典,fromkeys方法和get方法
199 0
|
Python
如何使用python对列表、字典、集合进行过滤筛选?
如何使用python对列表、字典、集合进行过滤筛选?
172 0
|
Python
Python批量提取多目录下多个word文档中的图片
Python批量提取多目录下多个word文档中的图片
204 0
Python批量提取多目录下多个word文档中的图片
|
Python
python搜索指定类型文件&批量移动文件程序
python搜索指定类型文件&批量移动文件程序
270 0
python搜索指定类型文件&批量移动文件程序
|
自然语言处理 算法
HanLP用户自定义词典源码分析详解
HanLP作者在HanLP issue783:上面说:词典不等于分词、分词不等于自然语言处理;推荐使用语料而不是词典去修正统计模型。由于分词算法不能将一些“特定领域”的句子分词正确,于是为了纠正分词结果,把想要的分词结果添加到自定义词库中,但最好使用语料来纠正分词的结果。
1722 0