在CSharp中调用HanLP

简介:

今天有用户想在CSharp里调用HanLP的API,遇到了些小问题。所以我干脆自己写了个指南,一步步演示IKVM与HanLP的集成方法,供广大C#程序员参考。本方法也可推广到用C#调用任何Java jar类库,并解决classpath的问题。

image

IKVM简介
IKVM.NET是一款开源的Java虚拟机,可以将hanlp.jar类库转为dll直接供C#程序调用,也可以直接当JVM让hanlp.jar运行在.NET平台上。请自行下载IKVM,本文使用的是ikvm-7.2.4630.5。

HanLP简介
HanLP是一个致力于向生产环境普及NLP技术的开源Java工具包,支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、神经网络依存句法分析)。

HanLP由3部分组成:类库hanlp.jar包、模型data包、配置文件hanlp.properties,请前往项目主页下载最新版:https://github.com/hankcs/HanLP/releases

下载后,你需要编辑配置文件第一行的root指向data的父目录,详见文档。

在IKVM中运行hanlp.jar
准备工作
Native JVM情况下,我们是这样调用hanlp.jar的,新建一个目录(假定为C:hanlp),把hanlp.jar和hanlp.properties放进去:

image

然后cd到这个目录内,一句命令行:

java -cp .;hanlp-1.2.7.jar com.hankcs.hanlp.summary.TextRankSentence
就能运行成功了:

[无限算法的产生是由于未能确定的定义终止条件, 这类算法在有限的时间内终止, 有限的非确定算法]
这里通过-cp选项指定了classpath为当前目录,这样HanLP就能找到hanlp.properties了。

另外,在新版HanLP中,移除了所有的main方法,所以可能会报找不到main方法的异常。新版用户不必纠结于命令行调用,直接写代码调用即可。

IKVM命令行
使用IKVM的话,只要将java换成ikvm即可:

C:ikvm-7.2.4630.5binikvm -cp .;hanlp-1.2.7.jar com.hankcs.hanlp.summary.TextRankSentence
效果是一样的:

image

在C#中调用HanLP
将hanlp.jar转为hanlp.dll
CSharp是不能直接调用jar包的,需要转为dll。IKVM提供了一个转换工具ikvmc,使用方法如下:

C:hanlp>C:ikvm-7.2.4630.5binikvmc -target:library C:hanlphanlp-1.2.7.jar
ikvmc会输出消息:

IKVM.NET Compiler version 7.2.4630.5
Copyright (C) 2002-2012 Jeroen Frijters
http://www.ikvm.net/

note IKVMC0002: Output file is "hanlp-1.2.7.dll"
同时会在C:hanlp目录下生成hanlp-1.2.7.dll。

在Visual Studio中使用hanlp.dll
首先新建一个CSharp项目:

image

然后引用刚才生成的hanlp.dll和ikvm-7.2.4630.5bin目录下的IKVM.OpenJDK.Core.dll这两个dll:

image

确定后就能在解决方案资源管理器中看到这两个dll了:

image

双击hanlp还能进入到类视图:

image

那么就可以愉快地写代码调用HanLP了:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using com.hankcs.hanlp;

namespace HanLPSharp
{

class Program
{
    static void Main(string[] args)
    {
        java.lang.System.getProperties().setProperty("java.class.path", "C:\\hanlp");
        Console.WriteLine(HanLP.segment("你好,欢迎在CSharp中调用HanLP的API!"));
        Console.ReadKey();
    }
}

}
解释一下,

java.lang.System.getProperties().setProperty("java.class.path", "C:\hanlp");
这句的作用是设置classpath到hanlp.properties所在的目录,请根据情况自由调整。

编译运行,效果如下:

image

这说明HanLP在CSharp中工作良好。
更多丰富的API
请参考HanLP的项目主页:https://github.com/hankcs/HanLP

Reference
http://stackoverflow.com/questions/3466698/where-does-ikvm-get-its-classpath-from

http://www.ikvm.net/uses.html

image

文章来源于网络

相关文章
|
Oracle 关系型数据库 数据库
oracle exp&imp之IMP-00037: Character set marker unknown
    最近,为地市技术人员做技术支持,碰到一个很奇怪的问题,别人给他提供一个exp的dmp文件,他在本地进行imp的时候报错:IMP-00037:Character set marker unknown 报错信息如下: C:\Users\localadmin>i...
4758 0
|
Web App开发 编解码 安全
在高版本谷歌Chrome浏览器中用VLC播放海康、大华RTSP实时视频完全方案
随着互联网基础设施的完善以及4G、5G等技术的大规模商用,在Chrome、Firefox、Edge等浏览器播放RTSP视频流也慢慢成为了信息化系统的行业标准。早些年还可用VLC播放器在网页中播放RTSP视频流,好景不长,2015年Chrome、Firefox等浏览器取消了对 NPAPI插件的支持,导致在高版本的Chrome等网页中播放海康威视、大华等摄像头RTSP视频流也成了奢望。
3310 0
|
11月前
|
物联网
如何在腾讯云等平台搭建自己的物联网MQTT服务器Broker
物联网技术及MQTT协议被广泛应用于各种场景。本文介绍物联网MQTT服务助手下载,如何搭建自己的物联网平台,并使用 “MQTT客户端调试工具”模拟MQTT设备,接入平台进行消息收发。
786 37
|
存储 设计模式 Java
为什么我们在程序开发设计中要基于接口而非实现编程?
为什么我们在程序开发设计中要基于接口而非实现编程?
309 2
EMQ
|
物联网 Linux C语言
在 Windows 平台搭建 MQTT 服务
NanoMQ 有着强大的跨平台和可兼容能力,不仅可以用于以 Linux 为基础的各类平台,也为 Windows 平台提供了 MQTT 服务的新选择。
EMQ
722 239
在 Windows 平台搭建 MQTT 服务
|
流计算 计算机视觉 索引
使用ffmpeg将视频转成HLS(m3u8)格式
HLS (HTTP Live Streaming)是苹果推出的视频流协议,HLS格式的视频包含一个m3u8文本文件,以及众多的.ts的视频片段,而m3u8文本文件的作用就是将这些ts片段索引起来。 因为HLS协议是将视频切分成很多小的ts片段,这些小片段很适合放到cdn上,有很多视频文章都使用了hls格式传输视频。今天我在这里教大家如何用ffmpeg将mp4格式的视频转为HLS(m3u8)格式。
1465 0
|
开发者 C# Windows
WPF与游戏开发:当桌面应用遇见游戏梦想——利用Windows Presentation Foundation打造属于你的2D游戏世界,从环境搭建到代码实践全面解析新兴开发路径
【8月更文挑战第31天】随着游戏开发技术的进步,WPF作为.NET Framework的一部分,凭借其图形渲染能力和灵活的UI设计,成为桌面游戏开发的新选择。本文通过技术综述和示例代码,介绍如何利用WPF进行游戏开发。首先确保安装最新版Visual Studio并创建WPF项目。接着,通过XAML设计游戏界面,并在C#中实现游戏逻辑,如玩家控制和障碍物碰撞检测。示例展示了创建基本2D游戏的过程,包括角色移动和碰撞处理。通过本文,WPF开发者可更好地理解并应用游戏开发技术,创造吸引人的桌面游戏。
976 0
|
索引
图片合成融合
【6月更文挑战第21天】
322 2
图片合成融合
|
Linux iOS开发 开发者
跨平台开发不再难:.NET Core如何让你的应用在Windows、Linux、macOS上自如游走?
【8月更文挑战第28天】本文提供了一份详尽的.NET跨平台开发指南,涵盖.NET Core简介、环境配置、项目结构、代码编写、依赖管理、构建与测试、部署及容器化等多个方面,帮助开发者掌握关键技术与最佳实践,充分利用.NET Core实现高效、便捷的跨平台应用开发与部署。
1664 3