如何进行中文命名实体识别?
(1)划分分类
命名实体一般有两种划分:3大类和7小类。
三大类:实体类、时间类、数字类
7小类:人名、地名、组织机构名、时间、日期、货币量、百分数
(2)识别思想
通常是先进行实体识别、然后识别单个实体、最后再识别复合实体
(3)实体标注方法
不同的数据集可能采取不同的实体标注方法,常见的标注方法又IOB、BIOES、Markup
其中IOB标注法,I表示内部,O表示外部,B表示开始
(4)识别方法
- 基于规则的方法
- 基于统计的方法
- 基于深度学习的方法