从String源码看Java中的编码
从String源码的一个构造方法说起
public String(int[] codePoints, int offset, int count) {}
what?codePoints是什么鬼?为了看懂这个源码,有必要了解一个这个codePoints(代码点)的相关知识,其实整个String源码都会不少的涉及的java编码的相关知识,比如indexOf(int ch, int fromIndex)。
句法敏感的实体表示用于神经网络关系抽取
信息抽取主要解决从海量文本中快速、准确地抽取出需求信息。关系抽取是信息抽取的关键技术之一,主要任务是从文本中识别出实体,并抽取实体间语义关系。把句法信息加入到实体的表示模型里是本文的创新之处和研究重点,下面,我们一起深入了解。
编码知识学习笔记之一
编码知识学习笔记之一
一.有哪些编码
1. ANSI
2.Unicode
3.Unicode big Endian
4.Unicode - ASCII Escaped
5.
GoldenDict:一款免费的词典工具
开源软件 GoldenDict 是一款“词典”管理软件。为什么称之为“词典”管理软件呢?因为准确地说,GoldenDict 它本身并没有提供任何的“词典”,而是仅提供词典所需的各方面功能,好比一些词典常见的功能也包含在内,即普通查询单词和屏幕截取单词、单词发音三大功能。
中文分词
SCWS
sphinx
lucene
Coreseek
httpcws