NLP比赛-小布助手对话短文本语义匹配

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: NLP比赛-小布助手对话短文本语义匹配

11.png

全球人工智能技术创新大赛

赛道三: 小布助手对话短文本语义匹配


赛题背景


小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。本赛题要求参赛队伍根据脱敏后的短文本query-pair,预测它们是否属于同一语义,提交的结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。


赛题描述及数据说明


训练数据


训练数据包含输入query-pair,以及对应的真值。初赛训练样本10万,复赛训练样本30万,这份数据主要用于参赛队伍训练模型,为确保数据的高质量,每一个样本的真值都有进行人工标注校验。每行为一个训练样本,由query-pair和真值组成,每行格式如下:

query-pair格式:query以中文为主,中间可能带有少量英文单词(如英文缩写、品牌词、设备型号等),采用UTF-8编码,未分词,两个query之间使用\t分割。

真值:真值可为0或1,其中1代表query-pair语义相匹配,0则代表不匹配,真值与query-pair之间也用\t分割。

训练数据样本举例(空白间隔为\t):
肖战的粉丝叫什么名字 肖战的粉丝叫什么 1
王者荣耀里面打野谁最厉害 王者荣耀什么英雄最好玩 0
我想换个手机 我要换手机 1
我是张睿 我想张睿 0
不想 不想说 0


测试数据


脱敏后的query-pair数据,初赛采用A/B榜的方式,A榜和B榜样本规模分别为5万,发布时间以赛制为准,初赛队伍根据初赛B榜排名择优进入复赛;复赛采用单榜方式,样本规模5万(与初赛不重复),复赛队伍根据复赛排名择优进入现场答辩。

测试数据样本举例(空白间隔为\t)

肖战的粉丝叫什么名字 肖战的粉丝叫什么
王者荣耀里面打野谁最厉害 王者荣耀什么英雄最好玩
我想换个手机 我要换手机
我是张睿 我想张睿
不想 不想说


提交说明


选手针对测试数据提交预测结果文件,结果文件中每行为一个预测值,是0与1之间的一个浮点数,代表query-pair语义匹配的概率,与测试数据每行一一对应。

结果文件内容举例

0.001
0.999


评估标准


比赛的评估标准由性能标准和效果标准两部分组成,初赛采用效果标准,AUC 指标,具体定义 如下:


10.png


其中:

rank(i):表示i这个样本的预测得分在测试集中的排序;

M:测试集中语义匹配的样本的个数;

N:测试集中语义不匹配的样本的个数。

复赛阶段将同时考虑性能标准和效果标准,效果标准继续采用 AUC 指标,性能标准是约束条件,在 复赛阶段需要在限定时间内完成预测,具体要求详见复赛开始前提供的“容器镜像”页面。


比赛规则


本项比赛全程不允许使用外部数据集。

允许使用预训练模型,如网络模型与embedding等。

复赛阶段允许使用初赛阶段的数据集。

相关文章
|
3月前
|
自然语言处理 监控 机器人
自然语言处理中的语义理解和生成技术
【8月更文第18天】自然语言处理(NLP)是计算机科学的一个重要分支,其目标是使计算机能够理解、解析和生成人类语言。近年来,基于Transformer架构的预训练模型(如BERT、GPT系列)已经极大地推动了NLP的发展。本文将探讨这些模型在对话系统、文本生成、情感分析等领域的应用,并讨论相关技术挑战。
141 1
|
4月前
|
机器学习/深度学习 自然语言处理
利用词嵌入和语义表示技术来提高自然语言处理任务的性能
利用词嵌入和语义表示技术来提高自然语言处理任务的性能
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在智能语音助手中的自然语言处理与语义理解
人工智能在智能语音助手中的自然语言处理与语义理解
|
6月前
|
机器学习/深度学习 自然语言处理 算法
什么是自然语言处理的语义理解?
【4月更文挑战第8天】
120 2
什么是自然语言处理的语义理解?
|
机器学习/深度学习 人工智能 自然语言处理
AI与自然语言处理:情感分析与语义理解
本文将探讨人工智能(AI)在自然语言处理(NLP)中的重要应用领域,即情感分析和语义理解。我们将介绍情感分析的基本概念,以及如何使用机器学习算法来识别和分类文本中的情感倾向。此外,我们还将讨论语义理解的技术和方法,包括词嵌入和语义角色标注。最后,我们将提供一个实例代码,演示如何使用Python和自然语言处理库来实现情感分析和语义理解。
489 0
|
存储 自然语言处理 UED
[NLP比赛推荐]商品标题实体识别
[NLP比赛推荐]商品标题实体识别
475 0
[NLP比赛推荐]商品标题实体识别
|
机器学习/深度学习 人工智能 运维
【Kaggle/天池/DF/biendata】比赛信息汇总(NLP、CV,ML)
【Kaggle/天池/DF/biendata】比赛信息汇总(NLP、CV,ML)
750 0
【Kaggle/天池/DF/biendata】比赛信息汇总(NLP、CV,ML)
|
机器学习/深度学习 传感器 数据采集
比赛推送:ML/NLP/推荐/CV,一大波比赛来袭!
比赛推送:ML/NLP/推荐/CV,一大波比赛来袭!
320 0
比赛推送:ML/NLP/推荐/CV,一大波比赛来袭!
|
机器学习/深度学习 自然语言处理 算法
NLP/多模态 比赛
NLP/多模态 比赛
410 0
|
自然语言处理 算法 大数据
比赛推送:图像/表格/CV/NLP,多线程开启!
比赛推送:图像/表格/CV/NLP,多线程开启!
161 0

热门文章

最新文章