中文依存句法分析概述及应用

简介:

句法分析是自然语言处理领域的一个关键问题,如能将其有效解决,一方面,可对相应树库构建体系的正确性和完善性进行验证;另一方面,也可直接服务于各种上层应用,比如搜索引擎用户日志分析和关键词识别,比如信息抽取、自动问答、机器翻译等其他自然语言处理相关的任务。

  短语结构和依存结构是目前句法分析中研究最广泛的两类文法体系。这里先大概介绍下依存结构。

  依存文法最早由法国语言学家L.Tesniere在其著作《结构句法基础》(1959年)中提出,对语言学的发展产生了深远的影响,特别是在计算语言学界备受推崇。

依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。

在20世纪70年代,Robinson提出依存语法中关于依存关系的四条公理,在处理中文信息的研究中,中国学者提出了依存关系的第五条公理,如下:

1、一个句子中只有一个成分是独立的;
2、其它成分直接依存于某一成分;
3、任何一个成分都不能依存与两个或两个以上的成分;
4、如果A成分直接依存于B成分,而C成分在句中位于A和B之间,那么C或者直接依存于B,或者直接依存于A和B之间的某一成分;
5、中心成分左右两面的其它成分相互不发生关系。

  句子成分间相互支配与被支配、依存与被依存的现象普遍存在于汉语的词汇(合成语)、短语、单句、复合直到句群的各级能够独立运用的语言单位之中,这一特点为 依存关系的普遍性,依存句法分析可以反映出句子各成分之间的语义修饰关系,它可以获得长距离的搭配信息,并与句子成分的物理位置无关。

附:LTP依存分析模块所使用的依存关系标记含义 (http://www.ltp-cloud.com/demo/)

 

现在的依存句法分析标注关系 (共14种) 及含义如下:

 

关系类型 Tag Description Example

主谓关系

SBV

subject-verb

我送她一束花 (我 <-- 送)

动宾关系

VOB

直接宾语,verb-object

我送她一束花 (送 --> 花)

间宾关系

IOB

间接宾语,indirect-object

我送她一束花 (送 --> 她)

前置宾语

FOB

前置宾语,fronting-object

他什么书都读 (书 <-- 读)

兼语

DBL

double

他请我吃饭 (请 --> 我)

定中关系

ATT

attribute

红苹果 (红 <-- 苹果)

状中结构

ADV

adverbial

非常美丽 (非常 <-- 美丽)

动补结构

CMP

complement

做完了作业 (做 --> 完)

并列关系

COO

coordinate

大山和大海 (大山 --> 大海)

介宾关系

POB

preposition-object

在贸易区内 (在 --> 内)

左附加关系

LAD

left adjunct

大山和大海 (和 <-- 大海)

右附加关系

RAD

right adjunct

孩子们 (孩子 --> 们)

独立结构

IS

independent structure

两个单句在结构上彼此独立

核心关系

HED

head

指整个句子的核心

 

 以前比较复杂的依存关系标记含义版本:

依存关系标记(共24个)
定中关系ATT(attribute)
数量关系QUN(quantity)
并列关系COO(coordinate)
同位关系APP(appositive)
前附加关系LAD(left adjunct)
后附加关系RAD(right adjunct)
动宾关系VOB(verb-object)
介宾关系POB(preposition-object)
主谓关系SBV(subject-verb)
比拟关系SIM(similarity)
核心HED(head)
连动结构VV(verb-verb)
关联结构CNJ(conjunctive)
语态结构MT(mood-tense)
独立结构IS(independent structure)
状中结构ADV(adverbial)
动补结构CMP(complement)
“的”字结构DE
“地”字结构DI
“得”字结构DEI
“把”字结构BA
“被”字结构BEI
独立分句IC(independent clause)
依存分句DC(dependent clause)


本文转自ZH奶酪博客园博客,原文链接:http://www.cnblogs.com/CheeseZH/p/4682166.html,如需转载请自行联系原作者

相关文章
|
25天前
|
监控 数据挖掘 UED
1688运营实战指南:从入门到精通的学习路径全解析!
在当今电商环境下,1688作为国内领先的B2B平台,已成为众多企业不可或缺的销售渠道。无论是源头工厂、批发商,还是寻求优质货源的创业者,掌握专业的1688运营技能都显得尤为重要。本文将为大家系统梳理1688运营的学习路径和实战方法,帮助商家少走弯路,快速提升店铺运营效果。
|
5月前
|
存储 缓存 前端开发
《解锁前端数据持久化与高效查询:IndexedDB深度剖析》
本文深入剖析了前端开发中IndexedDB在数据持久化存储与高效查询方面的核心价值。首先对比传统存储方案的局限,凸显IndexedDB在大容量、复杂数据类型支持上的优势;接着阐述其异步操作、事务支持、索引系统、版本控制等核心特性;随后详解数据持久化策略,包括结构设计、读写更新、清理机制;还介绍了高效查询技巧,如索引优化、游标运用、复杂查询组合;并结合离线应用、数据缓存等案例说明实际价值,最后提及跨浏览器兼容等挑战及应对思路。全文为前端开发者提供了系统化的IndexedDB应用指南,助力提升数据管理能力。
164 0
关于Neo4j的使用及其基本命令
关于Neo4j的使用及其基本命令
326 0
|
缓存 测试技术 API
解锁开源模型高性能服务:SGLang Runtime 应用场景与实践
SGLang 是一个用于大型语言模型和视觉语言模型的推理框架。
|
9月前
|
人工智能 数据可视化 前端开发
Probly:开源 AI Excel表格工具,交互式生成数据分析结果与可视化图表
Probly 是一款结合电子表格功能与 Python 数据分析能力的 AI 工具,支持在浏览器中运行 Python 代码,提供交互式电子表格、数据可视化和智能分析建议,适合需要强大数据分析功能又希望操作简便的用户。
1175 2
|
安全 API
通义千问API获取方法
访问阿里云DashScope官网以获取API-KEY。首先需开通DashScope服务:登录控制台,点击“去开通”,阅读协议后点击“立即开通”。接着获取API-KEY:进入API-KEY管理页面,点击“创建新的API-KEY”,复制并安全保存生成的API-KEY。完成这些步骤后,即可使用API-KEY调用DashScope API。更多详情见[官方文档](https://help.aliyun.com/zh/dashscope/developer-reference/acquisition-and-configuration-of-api-key)。
|
NoSQL 数据可视化 Linux
redis学习四、可视化操作工具链接 centos redis,付费Redis Desktop Manager和免费Another Redis DeskTop Manager下载、安装
本文介绍了Redis的两个可视化管理工具:付费的Redis Desktop Manager和免费的Another Redis DeskTop Manager,包括它们的下载、安装和使用方法,以及在使用Another Redis DeskTop Manager连接Redis时可能遇到的问题和解决方案。
1766 1
redis学习四、可视化操作工具链接 centos redis,付费Redis Desktop Manager和免费Another Redis DeskTop Manager下载、安装
Java 替换字符串 replace replaceAll
【7月更文挑战第10天】Java 替换字符串 replace replaceAll
Java 替换字符串 replace  replaceAll
|
机器学习/深度学习 自然语言处理 自动驾驶
深度学习应用领域有哪些?
深度学习在各种领域中都有广泛的应用,它的强大特性使其能够处理大量复杂的数据并进行高级的模式识别,从而改进了各种任务的性能和效率。
1349 3
|
Kubernetes 云计算 开发者
云计算中的容器化技术:Docker与Kubernetes的实践
云计算中的容器化技术:Docker与Kubernetes的实践
1308 0

热门文章

最新文章