利用HanLP计算中文词语语义相似度

简介:

HanLP官方GitHub地址
HanLP

在java项目中配置HanLP
推荐使用Maven方法
在poem.xml中加入以下代码

<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.3.3</version>


但是在AndroidStudio中,没有Maven,所以在build.gradle的dependencies中加入如下代码

compile "com.hankcs:hanlp:portable-1.3.3"
还可以下载jar包和data包,使用hanlp.properties进行手动配置
在 IntelliJ IDEA中进入file -> project structure,在Libraries中添加jar包

更改hanlp.properties中的首行,指向data包所在的位置

将hanlp.properties放在out -> production -> name目录下

调用HanLP
import com.hankcs.hanlp.dictionary.CoreSynonymDictionary;
只需要以上语句便可以使用HanLP

//使用hanlp计算语义距离
double[] numarray = new double[title_list.size()];

for (int i = 0; i < results.size(); i++) {
    for (int j = 0; j < title_list.size(); j++) {
        numarray[j] += CoreSynonymDictionary.similarity(results.get(i).name().toString(), title_list.get(j).toString());
    }
}

文章来源于citySouth的博客

相关文章
百万级高并发mongodb集群性能数十倍提升优化实践(上篇)
本文是oppo互联网某百亿级数据量/百万级高并发mongodb集群线上真实优化案例,荣获mongodb中文社区2019年度一等奖。
百万级高并发mongodb集群性能数十倍提升优化实践(上篇)
|
自然语言处理 搜索推荐 Java
计算文本相似度的几种方法
计算文本相似度的几种方法
|
数据采集 自然语言处理 算法
java应用集成HanLP进行中文自然语言分词详细完整案例以及demo源码
java应用集成HanLP进行中文自然语言分词详细完整案例以及demo源码
52200 1
java应用集成HanLP进行中文自然语言分词详细完整案例以及demo源码
|
自然语言处理
自然语言处理hanlp------3java调用hanlp
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
自然语言处理hanlp------3java调用hanlp
|
存储 缓存 算法
S32K3XX单片机DMA原理深度解析(上)
S32K3XX单片机DMA原理深度解析(上)
|
机器学习/深度学习 C++ 算法
机器学习模型的超参数优化(二)
机器学习模型的超参数优化(二)
1445 0
机器学习模型的超参数优化(二)
|
jenkins 持续交付 Go
iOS Jenkins打包报错401 Authentication credentials are missing or invalid.解决办法
iOS Jenkins打包报错401 Authentication credentials are missing or invalid.解决办法
564 0
|
存储 SQL JavaScript
SQL优化 21 连击 + 思维导图 上
SQL优化 21 连击 + 思维导图 上
|
数据可视化 安全 Java
QuickBI关于OpenAPI的使用问题梳理及高频需求实现样例
Quick BI企业客户所购买的多为专业版,且企业存在自有oa(办公)系统,组织架构庞大、复杂,系统多,权限分配及管理存在自有的集成系统统一管理,用以做到精准的权限管控。而Quick BI官方提供的OpenAPI提供了多样化的权限控制统一接口用以满足不同企业权限统一且自动化管控的的集成需求,本文针对Quick BI的工作流程、使用方法及限制以及针对高频场景从OpenAPI Explorer到封装python SDK由浅入深的给出了多种调用方式的使用样例。