hanlp添加自定义字典的步骤介绍

简介: 本篇分享一个hanlp添加自定义字典的方法,供大家参考!总共分为两步:第一步:将自定义的字典放到custom目录下,然后删除CustomDicionary.txt.bin,因为分词的时候会读这个文件。

本篇分享一个hanlp添加自定义字典的方法,供大家参考!
总共分为两步:
第一步:将自定义的字典放到custom目录下,然后删除CustomDicionary.txt.bin,因为分词的时候会读这个文件。如果没有的话它会根据配置文件中路径去加载字典生成bin文件。
_1

第二步:去配置文件把自己添加自定义的文件的路径添加进去,注意一定要添加末尾后面而且结束时不能有;号,我添加在其他位置都不好使。而且相对路径也不好使
_2

上面是把bin文件删掉后跑起来的样子,会等一两分钟生成bin文件。

相关文章
|
5月前
|
存储 开发者 Python
Python中的collections模块与UserDict:用户自定义字典详解
【4月更文挑战第2天】在Python中,`collections.UserDict`是用于创建自定义字典行为的基类,它提供了一个可扩展的接口。通过继承`UserDict`,可以轻松添加或修改字典功能,如在`__init__`和`__setitem__`等方法中插入自定义逻辑。使用`UserDict`有助于保持代码可读性和可维护性,而不是直接继承内置的`dict`。例如,可以创建一个`LoggingDict`类,在设置键值对时记录操作。这样,开发者可以根据具体需求定制字典行为,同时保持对字典内部管理的抽象。
|
5月前
|
Python
基于Python读取Excel表格文件数据并转换为字典dict格式
基于Python读取Excel表格文件数据并转换为字典dict格式
基于Python读取Excel表格文件数据并转换为字典dict格式
|
自然语言处理 搜索推荐 Python
jieba分词器(应用及字典的补充)及文档高频词提取实战
jieba分词器(应用及字典的补充)及文档高频词提取实战
|
Python
python批量默认初始化与获取字典,fromkeys方法和get方法
python批量默认初始化与获取字典,fromkeys方法和get方法
194 0
|
Python
如何使用python对列表、字典、集合进行过滤筛选?
如何使用python对列表、字典、集合进行过滤筛选?
166 0
|
Python
Python批量提取多目录下多个word文档中的图片
Python批量提取多目录下多个word文档中的图片
200 0
Python批量提取多目录下多个word文档中的图片
对比excel,如何在Python中实现 “自定义文本” 排序!
对比excel,如何在Python中实现 “自定义文本” 排序!
对比excel,如何在Python中实现 “自定义文本” 排序!
|
Python
python搜索指定类型文件&批量移动文件程序
python搜索指定类型文件&批量移动文件程序
262 0
python搜索指定类型文件&批量移动文件程序
HanLP-停用词表的使用示例
停用词表的修改停用词表在“pyhanlpstaticdatadictionary”路径下的“stopwords.txt”文件中,CoreStopWordDictionary.apply方法支持去除停用词。
5507 0
|
自然语言处理 算法
HanLP用户自定义词典源码分析详解
HanLP作者在HanLP issue783:上面说:词典不等于分词、分词不等于自然语言处理;推荐使用语料而不是词典去修正统计模型。由于分词算法不能将一些“特定领域”的句子分词正确,于是为了纠正分词结果,把想要的分词结果添加到自定义词库中,但最好使用语料来纠正分词的结果。
1717 0