中国团队获多项佳绩 | SemEval 2026任务3回顾

简介: 简介SemEval 2026任务3的赛题及竞赛结果、以及ABSA(基于方面的情感分析)和Dimensional ABSA(维度ABSA)的概念

ABSA(Aspect-Based Sentiment Analysis、基于方面的情感分析)是一种较细粒度的情感分析,能针对文本中某一实体的某一方面(Aspect),分析文本中所蕴含的情感倾向,例如针对某商品的价格、体积、或性能方面,分析商品描述中所蕴含的情感倾向,分析的结果一般是针对目标实体的目标方面的情感分类,例如正面/负面/中性的分类。

心理学和情感科学(Affective Science)中经常采用(Valence,Arousal)二维数值来表示情感:

  • Valence维度表示情感的负面或正面的倾向性,两个极端分别是极端负面和极端正面;
  • Arousal维度表示情感的强烈程度,两个极端分别是极为平静、疲倦和极为兴奋、紧张。

Figure_1.jpg

Valence-Arousal二维空间示意图[1]

将Valence-Arousal情感表示方法与经典的ABSA情感分析相结合,使得ABSA情感分析的结果从离散型的情感分类,转变为连续型的、含义更加丰富、细致的(Valence,Arousal)二维数值,这就是近年来出现的Dimensional ABSA(维度ABSA)的主要思路。

SemEval 2026竞赛中的任务3(Task 3)正是围绕Dimensional ABSA这一主题,由全球多所大学与研究机构的研究人员共同组织的一次竞赛。该任务3吸引了全球20多个国家的超过400名参与者,44个团队最终提交了参赛结果。来自中国的多个团队在该任务的多个赛道、多个子任务的比拼中获得了多项优异成绩,其中包括多项第一名和第二名[1]。

SemEval 2026的任务3设立了两个赛道:赛道A(Track A)和赛道B(Track B)。

赛道A

赛道A(Track A)下设了三个子任务(Subtasks、简称ST)。参赛团队可任选一个或多个子任务参与。

子任务1(Subtask 1、简称ST1)要求针对给出的语句、以及给出的一个或多个目标方面(Aspect),预测每个目标方面的(Valence,Arousal)二维数值。

子任务2(Subtask 2、简称ST2)要求针对给出的语句:

  • 提取句中所有涉及方面(Aspect)的词语(例如:服务、屏幕、盈利)、以及句中涉及相关方面的情感用语(例如:非常好、极差、有点慢),
  • 预测提取出的各方面(Aspect)的(Valence,Arousal)二维数值。

子任务3(Subtask 3、简称ST3)要求针对给出的语句:

  • 提取句中所有涉及方面(Aspect)的词语(例如:服务、屏幕、盈利),
  • 为提取出的各方面的词语进行分类(分类体系已预先设定,分类的格式为:实体#属性,例如:食品#质量、服务#综合),
  • 提取句中涉及各方面的情感用语(例如:非常好、极差、有点慢),
  • 预测句中各方面的(Valence,Arousal)二维数值。

赛道A的数据集涵盖中、英、日、俄等六个语种,以及金融、餐厅、酒店、笔记本电脑四个领域。下图是赛道A数据集的英语-餐厅领域的数据示例[2],其中,ST表示子任务(Subtask),下划线标出的是目标方面(Aspect)。

Dataset_A_2.jpg

赛道B

赛道B(Track B)的设立旨在将Dimensional ABSA的应用场景从分析消费者评价,扩展到分析政治、能源、气候等公共话题的讨论。

具体而言,赛道B旨在将分析价格、服务等方面(Aspect)的方法,沿用于分析政治、能源、气候、交通、教育、社会等公共话题讨论中的“立场”(Stance),要求针对给出的一段文本、以及给出的一个或多个目标立场,预测每个目标立场的(Valence,Arousal)二维数值。

赛道B的数据集涵盖中、英、德等五个语种,以及环境保护和政治两个领域。下图是赛道B数据集中的数据示例[3],其中,高亮背景部分为目标立场(Stance),V#A是Valence#Arousal的缩写。

Dataset_B_2.jpg

参赛系统分析

以下几张统计图展示了对任务3两个赛道参赛系统的统计分析。

Figure_3.jpg

按模型架构类型统计的参赛系统数量和占比分布


Figure_4.jpg

参赛系统中采用较多的LLM、以及两个赛道中各有多少参赛系统采用了这些LLM


Figure_5.jpg

按模型训练方法统计的参赛系统数量和占比分布


Figure_6.jpg

按模型微调策略统计的参赛系统数量和占比分布


Figure_7.jpg

按提示语策略统计的参赛系统数量和占比分布

参考文献

以下参考文献的使用许可协议均为CC BY 4.0。

https://creativecommons.org/licenses/by/4.0/

[1] SemEval-2026 Task 3: Dimensional Aspect-Based Sentiment Analysis (DimABSA)

https://arxiv.org/abs/2604.07066

[2] DimABSA: Building Multilingual and Multidomain Datasets for Dimensional Aspect-Based Sentiment Analysis

https://arxiv.org/abs/2601.23022

[3] DimStance: Multilingual Datasets for Dimensional Stance Analysis

https://arxiv.org/abs/2601.21483

目录
相关文章
|
17天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
34817 44
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
11天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
10779 36
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
6天前
|
人工智能 JavaScript Ubuntu
低成本搭建AIP自动化写作系统:Hermes保姆级使用教程,长文和逐步实操贴图
我带着怀疑的态度,深度使用了几天,聚焦微信公众号AIP自动化写作场景,写出来的几篇文章,几乎没有什么修改,至少合乎我本人的意愿,而且排版风格,也越来越完善,同样是起码过得了我自己这一关。 这个其实OpenClaw早可以实现了,但是目前我觉得最大的区别是,Hermes会自主总结提炼,并更新你的写作技能。 相信就冲这一点,就值得一试。 这篇帖子主要就Hermes部署使用,作一个非常详细的介绍,几乎一步一贴图。 关于Hermes,无论你赞成哪种声音,我希望都是你自己动手行动过,发自内心的选择!
2254 22
|
29天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
45715 156
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
11天前
|
机器学习/深度学习 存储 人工智能
还在手写Skill?hermes-agent 让 Agent 自己进化能力
Hermes-agent 是 GitHub 23k+ Star 的开源项目,突破传统 Agent 依赖人工编写Aegnt Skill 的瓶颈,首创“自我进化”机制:通过失败→反思→自动生成技能→持续优化的闭环,让 Agent 在实践中自主构建、更新技能库,持续自我改进。
1725 6
|
4天前
|
人工智能 弹性计算 安全
Hermes Agent是什么?怎么部署?超详细实操教程
Hermes Agent 是 Nous Research 于2026年2月开源的自进化AI智能体,支持跨会话持久记忆、自动提炼可复用技能、多平台接入与200+模型切换,真正实现“越用越懂你”。MIT协议,部署灵活,隐私可控。
1399 2

热门文章

最新文章

下一篇
开通oss服务