CLEF(Conference and Labs of the Evaluation Forum)协会起源于欧洲,近年来每年发起CLEF会议及竞赛,吸引了来自世界各地的参会者和参赛者。
CLEF会议及竞赛的主题侧重于多语种、多模态信息系统的研究、调优与评估。CLEF竞赛的结果在当年的CLEF会议上进行总结。
来自中国的多个团队曾多次在CLEF竞赛中取得优异成绩!
今年的CLEF竞赛包含16个赛道,各赛道的赛题已经公布。多数赛道的参赛报名截止于今年4月份;对竞赛结果的总结将于9月下旬在德国城市Jena(耶拿)召开的CLEF会议上进行[1]。
接下来将简要介绍今年CLEF竞赛中的3个赛道:PAN、FinMMEval和CheckThat!
PAN
PAN这一赛道的历史可以追溯至2007年;该赛道侧重文本风格分析与文本取证方面的评测。今年的PAN赛道设立了五个细分赛道(又称“Shared Tasks”)[2]。
细分赛道1、Voight-Kampff生成式AI检测(Voight-Kampff Generative AI Detection)。Voight-Kampff一词源于科幻电影《Blade Runner》;在影片中,Voight-Kampff测试用于区分一个人是真人还是复制人(一种合成的、在外表和行为上与人类高度相似的生物)。Voight-Kampff测试有点类似于图灵测试。
“Voight-Kampff生成式AI检测”这一细分赛道要求参赛系统针对给出的文本,检测文本是否由AI生成;在被检测的文本中,AI生成的文本会由AI试图消除AI生成的特征。
细分赛道2、文本水印(Text Watermarking)。不少AI公司在大语言模型的输出中嵌入水印(即可检测的特征)。这种做法推动了针对水印的新的研究以及水印技术的创新[3]。在这种背景下,PAN赛道设立了“文本水印”这一细分赛道。
该细分赛道要求参赛系统先为给出的文本加水印,然后将加了水印的文本由竞赛组织方进行修改(即攻击),以尝试破坏文本的水印;修改后的文本返回至参赛系统的水印检测算法,以检测文本中是否存在水印。该细分赛道旨在评测水印的隐蔽性及其对于文本修改的鲁棒性。
细分赛道3、多作者写作风格分析(Multi-author Writing Style Analysis),要求参赛系统针对给出的文本,识别出所有写作风格出现变化的位置。
细分赛道4、生成式抄袭检测(Generative Plagiarism Detection),包含两个子任务。
- 子任务1、源文档检索:针对一个可疑文档和多个可能的源文档,自动识别出可疑文档所抄袭的所有源文档。
- 子任务2、文本对齐:将可疑文档中抄袭来的段落与源文档中被抄袭的段落自动对齐。一个抄袭来的段落可能对应于多个源段落(合并抄袭),多个抄袭来的段落也可能对应于一个源段落(扩展抄袭)。
细分赛道5、推理轨迹检测(Reasoning Trajectory Detection)。LLM的显式推理可以提高LLM回答的整体质量和安全性。然而,虚假的、不合逻辑的、以及不安全的中间推理可能导致错误或有害的回答。此外,欺骗性的、以及未对齐的中间推理也可能产生安全的回答。
为了加深对LLM推理的理解,减少不安全的推理,“推理轨迹检测”细分赛道设立了以下两个子任务。
- 子任务1、来源检测:针对给出的(用户提问、推理轨迹、最终答案)三元组,自动识别出其中的推理轨迹和最终答案是由AI生成还是由人类撰写的。该子任务的目的是对人类和模型的推理风格及认知结构进行深入的比较,为模型对齐和推理训练策略提供更多参考。
- 子任务2、安全性检测:在给出的(用户提问、推理轨迹、最终答案)三元组中,用户提问分为三种类型——(1)寻求有害内容的提问、(2)越狱攻击(Jailbreak Attacks)、(3)含有风险Token的提问。该子任务要求参赛系统针对这样的三元组,判断三元组中的推理轨迹和最终答案是否安全。
【未完待续】
参考文献
[1] https://www.clef-initiative.eu/
[2] Overview of PAN 2026: Voight-Kampff Generative AI Detection, Text Watermarking, Multi-Author Writing Style Analysis, Generative Plagiarism Detection, and Reasoning Trajectory Detection
https://arxiv.org/abs/2602.09147
使用许可协议:CC BY 4.0
https://creativecommons.org/licenses/by/4.0/
[3] https://pan.webis.de/clef26/pan26-web/text-watermarking.html#related-work
封面图:CLEF 2026会议的主办地德国Jena(耶拿);图片由Bruno Joseph和pexels.com提供