mesh词表Medical Subject Headings - Home Page (nih.gov)
基础自然语言处理
文本数据结构化,归一化处理
医学知识图谱与本体知识库构建,自动更新
中文分词
将一段医疗文本,按照一定的规范重新组合成词序列的过程,是进一步文本分析的基础
实体识别
识别医疗文本中具有特定意义的医学术语,如“诊断名”,“药品名”,“手术名”等,及一些明确语义的属性信息,如“时间”,“程度”等,这些概念的识别是医疗文本语义分析的重要前提。
实体关系识别
识别文本中实体与其他实体之间的关系,如针对一次化疗事件,识别出“化疗方案”的“时间”是哪个,“化疗方案”的“疗效”是哪个等,这些实体关系的识别是进行结构化信息抽取的重要依据。
结构化
基于任务需求,设计业务规则,从实体识别和实体关系识别的结果中,根据授权抽取结构化任务目标信息。
标准化
模仿人的归一过程,采用基于知识图谱的实体链接技术,根据授权将临床数据归一到标准名称,例如手术归一到ICD9,诊断名归一到ICD10,便于后续各任务的筛选统计等分析。
知识图谱
依托医疗人工智能技术,构建大规模医疗知识库,支持医疗统计、查询、分析、推理等任务。