中国团队获多项佳绩 | SemEval 2026任务3回顾

简介: 简介SemEval 2026任务3的赛题及竞赛结果、以及ABSA(基于方面的情感分析)和Dimensional ABSA(维度ABSA)的概念

ABSA(Aspect-Based Sentiment Analysis、基于方面的情感分析)是一种较细粒度的情感分析,能针对文本中某一实体的某一方面(Aspect),分析文本中所蕴含的情感倾向,例如针对某商品的价格、体积、或性能方面,分析商品描述中所蕴含的情感倾向,分析的结果一般是针对目标实体的目标方面的情感分类,例如正面/负面/中性的分类。

心理学和情感科学(Affective Science)中经常采用(Valence,Arousal)二维数值来表示情感:

  • Valence维度表示情感的负面或正面的倾向性,两个极端分别是极端负面和极端正面;
  • Arousal维度表示情感的强烈程度,两个极端分别是极为平静、疲倦和极为兴奋、紧张。

Figure_1.jpg

Valence-Arousal二维空间示意图[1]

将Valence-Arousal情感表示方法与经典的ABSA情感分析相结合,使得ABSA情感分析的结果从离散型的情感分类,转变为连续型的、含义更加丰富、细致的(Valence,Arousal)二维数值,这就是近年来出现的Dimensional ABSA(维度ABSA)的主要思路。

SemEval 2026竞赛中的任务3(Task 3)正是围绕Dimensional ABSA这一主题,由全球多所大学与研究机构的研究人员共同组织的一次竞赛。该任务3吸引了全球20多个国家的超过400名参与者,44个团队最终提交了参赛结果。来自中国的多个团队在该任务的多个赛道、多个子任务的比拼中获得了多项优异成绩,其中包括多项第一名和第二名[1]。

SemEval 2026的任务3设立了两个赛道:赛道A(Track A)和赛道B(Track B)。

赛道A

赛道A(Track A)下设了三个子任务(Subtasks、简称ST)。参赛团队可任选一个或多个子任务参与。

子任务1(Subtask 1、简称ST1)要求针对给出的语句、以及给出的一个或多个目标方面(Aspect),预测每个目标方面的(Valence,Arousal)二维数值。

子任务2(Subtask 2、简称ST2)要求针对给出的语句:

  • 提取句中所有涉及方面(Aspect)的词语(例如:服务、屏幕、盈利)、以及句中涉及相关方面的情感用语(例如:非常好、极差、有点慢),
  • 预测提取出的各方面(Aspect)的(Valence,Arousal)二维数值。

子任务3(Subtask 3、简称ST3)要求针对给出的语句:

  • 提取句中所有涉及方面(Aspect)的词语(例如:服务、屏幕、盈利),
  • 为提取出的各方面的词语进行分类(分类体系已预先设定,分类的格式为:实体#属性,例如:食品#质量、服务#综合),
  • 提取句中涉及各方面的情感用语(例如:非常好、极差、有点慢),
  • 预测句中各方面的(Valence,Arousal)二维数值。

赛道A的数据集涵盖中、英、日、俄等六个语种,以及金融、餐厅、酒店、笔记本电脑四个领域。下图是赛道A数据集的英语-餐厅领域的数据示例[2],其中,ST表示子任务(Subtask),下划线标出的是目标方面(Aspect)。

Dataset_A_2.jpg

赛道B

赛道B(Track B)的设立旨在将Dimensional ABSA的应用场景从分析消费者评价,扩展到分析政治、能源、气候等公共话题的讨论。

具体而言,赛道B旨在将分析价格、服务等方面(Aspect)的方法,沿用于分析政治、能源、气候、交通、教育、社会等公共话题讨论中的“立场”(Stance),要求针对给出的一段文本、以及给出的一个或多个目标立场,预测每个目标立场的(Valence,Arousal)二维数值。

赛道B的数据集涵盖中、英、德等五个语种,以及环境保护和政治两个领域。下图是赛道B数据集中的数据示例[3],其中,高亮背景部分为目标立场(Stance),V#A是Valence#Arousal的缩写。

Dataset_B_2.jpg

参赛系统分析

以下几张统计图展示了对任务3两个赛道参赛系统的统计分析。

Figure_3.jpg

按模型架构类型统计的参赛系统数量和占比分布


Figure_4.jpg

参赛系统中采用较多的LLM、以及两个赛道中各有多少参赛系统采用了这些LLM


Figure_5.jpg

按模型训练方法统计的参赛系统数量和占比分布


Figure_6.jpg

按模型微调策略统计的参赛系统数量和占比分布


Figure_7.jpg

按提示语策略统计的参赛系统数量和占比分布

参考文献

以下参考文献的使用许可协议均为CC BY 4.0。

https://creativecommons.org/licenses/by/4.0/

[1] SemEval-2026 Task 3: Dimensional Aspect-Based Sentiment Analysis (DimABSA)

https://arxiv.org/abs/2604.07066

[2] DimABSA: Building Multilingual and Multidomain Datasets for Dimensional Aspect-Based Sentiment Analysis

https://arxiv.org/abs/2601.23022

[3] DimStance: Multilingual Datasets for Dimensional Stance Analysis

https://arxiv.org/abs/2601.21483

目录
相关文章
|
9月前
|
自然语言处理 计算机视觉 Python
SoccerNet 2025挑战赛:赛题整理(一)
介绍SoccerNet数据集和SoccerNet 2025挑战赛,并梳理SoccerNet 2025挑战赛中的赛题一
1252 96
【推荐】排序模型的评价指标nDCG
nDCG(Normalized Discounted Cumulative Gain)归一化折损累计增益是一种用于评估排序模型性能的指标,它考虑了两个方面:排序的正确性和相关性的程度。
4954 0
|
2月前
|
自然语言处理 前端开发 Shell
《QClaw多语言开发从入门到精通指南》
本文针对开发者跨语言开发时普遍面临的语法学习成本高、生态差异大、工具配置繁琐、跨语言集成复杂等核心痛点,基于深度使用实践,全面拆解了QClaw覆盖200+编程语言的全栈开发辅助能力。文章详细阐述了其在主流工业级语言、系统级高性能语言、前端全栈生态、脚本工具链语言、领域特定语言及小众新兴语言上的全生命周期支持,分析了其自动生成符合行业最佳实践代码与配置的核心优势,并分享了多语言开发的实用技巧与最佳实践,帮助开发者彻底跨越语言壁垒,专注于业务逻辑与架构设计,大幅提升开发效率。
310 7
|
2月前
|
人工智能 前端开发 JavaScript
2026 Python UI 框架选择指南:从 Streamlit 到 Pyside6 的四层体系
2026年Python UI开发已进入“AI+框架”时代!本文提出四层选型体系:①极速原型层(Streamlit/Gradio,30分钟出MVP,AI生成极友好);②轻量产品层(NiceGUI/Flet,兼顾颜值与交付);③工程化Web层(Reflex/Python+React,支撑长期商业化);④本地重型层(PySide6/Dear PyGui,专注离线高性能)。告别盲目选框架,按场景+AI适配度精准决策!
700 0
2026 Python UI 框架选择指南:从 Streamlit 到 Pyside6 的四层体系
|
2月前
|
安全 Linux iOS开发
Binary Ninja 5.3.9434 发布 - 反编译器、反汇编器、调试器和二进制分析平台
Binary Ninja 5.3.9434 (macOS, Linux, Windows) - 反编译器、反汇编器、调试器和二进制分析平台
336 0
Binary Ninja 5.3.9434 发布 - 反编译器、反汇编器、调试器和二进制分析平台
|
2月前
|
缓存 中间件 测试技术
阿里云服务器2核16G活动报价:通用算力型u2i实例1095.98元起,内存型r9i实例2736.75元起
阿里云2026年活动推出2核16G云服务器配置,满足特定应用场景的高内存需求。通用算力型u2i实例提供高性价比的大内存解决方案,年付价格1095.98元起,适合中小型数据库、缓存服务及应用服务器中间件等场景。内存型r9i实例则提供极致内存性能,年付价格2736.75元起,适合高性能关系型数据库、内存数据库及大数据分析等严苛场景。用户可根据业务需求及预算选择合适的实例类型,享受阿里云带来的灵活、高效的云服务体验。
408 8
|
2月前
|
PHP 索引
PHP 8+ 实用技巧三则:代码更优雅高效
PHP 8+ 实用技巧三则:代码更优雅高效
|
3月前
|
人工智能 自然语言处理 语音技术
CLEF 2026赛道简介:PAN、FinMMEval、CheckThat!(下)
CLEF 2026竞赛包含16个赛道,本文的下半部分简要介绍其中的FinMMEval和CheckThat!赛道
275 5
|
3月前
|
人工智能 JavaScript 前端开发
Seedance 原理全解:从架构设计到核心代码,这篇彻底讲清楚了
本文深度解析字节跳动Seedance视频生成模型:从1.5 Pro到2.0的架构演进,揭秘双分支扩散、MM-RoPE位置编码与帧级音画同步原理;手把手演示Python/Node.js调用、重试机制及Prompt优化技巧,助开发者真正落地AI视频生产。
|
3月前
|
人工智能 安全 算法
CLEF 2026赛道简介:PAN、FinMMEval、CheckThat!(上)
CLEF 2026竞赛包含16个赛道,本文分上下两部分介绍其中的3个赛道:PAN、FinMMEval和CheckThat!
383 1