大规模开放数字商业知识图谱评测基准来了:OpenBG上线天池

简介: 大规模开放数字商业知识图谱评测基准来了:OpenBG上线天池


在数字商业领域,知识图谱业务的蓬勃发展在许多应用显示出了巨大的潜力,但它仍面临着诸多挑战。由阿里巴巴藏经阁团队和浙江大学开放的数字商业知识图谱评测基准 OpenBG 提供了丰富的数字商业领域知识图谱的评测数据集,覆盖基于知识图谱的商品显著性推理、商品同款挖掘、商品知识图谱链接预测等任务,对模型展开了全方位评测,旨在帮助算法人员对模型取得更好的理解。



近年来,知识图谱受到学术界和产业界的广泛关注,在教育、生物医学、金融等领域得到了广泛的应用,凸显了结构化知识在智能应用中的重要作用。2020 年图灵奖得主 LeCun、Bengio 和 Hinton 在 2015 年《Nature》论文[1]曾指出:融合表示学习与复杂知识推理是人工智能进步的阶梯。在数字商业领域,知识图谱业务的蓬勃发展在许多应用显示出了巨大的潜力,但它仍面临着诸多挑战。例如,现有的商业知识图谱往往存在大量的缺失属性、实体节点和大量相同的未对齐的实体节点,且知识图谱通常由多种模态构成,因而如何对大规模数字知识图谱进行链接预测和实体对齐(同款商品挖掘)面临严峻挑战;此外,现有的知识图谱通常缺乏对知识显著性的建模,如当用户在电商平台搜索 “跑步”关键词 时,“瓶装水”一般不是用户真实的购物意图,用户关注的商品一般是 “跑步鞋、跑步机” 等健身用品。显著的常识可以帮助搜索引擎有更好的理解能力,从而返回更贴合用户需要的商品,因此如何基于数字商业知识图谱进行商品显著性推理也面临巨大挑战。


由阿里巴巴藏经阁团队和浙江大学开放的数字商业知识图谱评测基准 OpenBG Benchmark 提供了在数字商业领域知识图谱的评测数据集,覆盖基于知识图谱的商品显著性推理、商品同款挖掘、电商知识图谱链接预测等任务,对模型展开了全方位的评测,旨在帮助科研和算法人员对模型取得更好的理解。


OpenBG Benchmark 介绍


OpenBG Benchmark 是一个大规模开放数字商业知识图谱评测基准,包含多个子数据集任务。数据集以开放的数字商业知识图谱 OpenBG[2]为基础构建,OpenBG 是开放的数字商业知识图谱,是一个使用统一 Schema 组织、涵盖产品和消费需求的百万级多模态数据集。OpenBG 由阿里巴巴藏经阁团队和浙江大学提供,开放的目标是利用开放的商业知识发现社会经济的价值,促进数字商务数字经济等领域的交叉学科研究,服务数字经济健康发展的国家战略需求。首期开放包含以下三大类任务:


商品常识知识显著性推理


  • 任务描述


常识知识是被社会广泛承认的对同一事物普遍存在的日常共识。在电商场景中,显著性常识基于背后的知识体系,能为不同的用户推荐合适的商品,对用户体验和购物效率有重要的意义。现有的常识分类方法往往只注重评判常识是否合理,如 "跑步需要喝水"、"出差需要背包"。但当在电商平台搜索 "跑步" 时,瓶装水一般不是用户真实的购物意图,用户关注的商品一般是 “跑步鞋”、“跑步机” 等健身用品;在搜索 "出差" 时,“背包”一般并不是用户需要的商品,但 “旅行箱” 可能是符合用户意图的商品。显著的常识可以帮助搜索引擎有更好的理解能力,从而返回更贴合用户需要的商品。


  • 任务说明


本任务要求对电商常识三元组的显著性进行判断,即给定常识三元组(S,P,O),输出其显著性分类标签,如下表所示,其中 1 表示显著,0 表示不显著。


商品同款挖掘


  • 任务描述


同款商品是指商品的重要属性完全相同且客观可比的商品,商品同款识别的主要目的是从海量结构化和无结构化的商品图文数据库中匹配得到同款商品,是构建电商产品关系的重要环节。商品同款作为商品知识图谱的重要组成部分,有很多应用场景,如同款商品发现等。


  • 任务说明


我们将商品同款识别任务定义为二分类任务,即给定商品对信息,判断商品 item 是否同款,示例如下:



商品关系推理与链接预测


  • 任务描述


由于知识图谱普遍存在不完整的问题,因此需要关系推理与链接预测技术对缺失的图谱节点进行预测。本任务旨在提升数字商业场景下知识图谱嵌入效果,满足商品推荐等应用对推理商品潜在关联性的需求。


  • 任务说明


知识图谱一般通过三元组(h,r,t)的形式组织数据,其中 h 被称为头实体,t 为尾实体,r 为连接头、尾实体的关系。如下图所示(“化妆棉”,“品牌”,“屈臣氏”)就是一个图谱三元组。知识图谱的链接预测任务指的是已知头实体(或尾实体)和关系的情况下,预测缺失的尾实体(或头实体)。下图中,(“化妆棉”,“适用群体”,?)就是一个链接预测任务,需要预测出尾实体。


  • 数据集


与商品常识显著性推理以及同款挖掘任务不同的是,链接预测任务由 3 个子任务数据集组成:OpenBG500、OpenBG500-L 和 OpenBG-IMG。其中 OpenBG500 包含 500 类关系,含百万级别规模的图谱数据;OpenBG500-L 在 OpenBG500 的基础上扩大了数据规模,含千万级别规模的图谱数据,是电子商务领域大规模的知识图谱;OpenBG-IMG 是电商领域的多模态知识图谱。3 个数据集均以 OpenBG 为基础构建,构建流程如下:


OpenBG Benchmark 挑战榜


OpenBG Benchmark 的提出旨在解决当前数字商业领域知识图谱数据集相对匮乏的问题,为算法和科研人员提供评测基准去衡量算法模型的有效性。基于 OpenBG Benchmark 阿里巴巴藏经阁团队曾在 CCKS2022 大会成功组织了学术评测比赛,吸引了 3000 多支队伍报名参赛。目前 OpenBG Benchmark 已经在阿里云天池平台长期开放,感兴趣的研究者们可以访问如下链接参与挑战,平台会在每个月的月底评出榜单 Top5 选手,并赠予天池定制礼品!


挑战榜地址:https://tianchi.aliyun.com/dataset/122271


官方也提供了基线代码供算法人员参考: https://github.com/OpenBGBenchmark


OpenBG 参考论文如下:

  • Qu, Yincen, et al. "Commonsense Knowledge Salience Evaluation with a Benchmark Dataset in E-commerce." Findings of EMNLP 2022.
  • Xie, Xin, et al. "From Discrimination to Generation: Knowledge Graph Completion with Generative Transformer." WWW 2022 (Poster).
  • Deng, Shumin, et al. "Construction and Applications of Billion-Scale Multimodal Pre-trained Business Knowledge Graph." arXiv preprint arXiv:2209.15214  2022.


引用:

[1] https://www.nature.com/articles/nature14539

[2] https://kg.alibaba.com

相关文章
|
7月前
|
人工智能 监控 安全
数据、AI涌现的年代,迭代数字平台,更需关注安全合规问题
在当下,无论是企业想谋求数字化转型升级,还是想要出海走出去,首先基本上都会对自己的数字体验系统进行重塑,而这其中关于的安全合规问题,也成为了决定企业选择何种技术进行系统迭代更新的关键。
130 0
|
2月前
|
人工智能 弹性计算 监控
《触手可及,函数计算玩转AI大模型解决方案评测》
本文介绍了函数计算在AI大模型部署中的应用,详细阐述了其原理、部署体验及优势。通过实践,验证了函数计算在弹性伸缩、部署便捷性和成本效益方面的显著优势。同时,提出了在高级特性、性能优化、安全性及高可用性等方面的改进建议,以提升方案在实际生产环境中的适用性和可靠性。
51 3
|
2月前
|
数据采集 人工智能 搜索推荐
《AI大模型助力客户对话分析解决方案评测》
该方案详细描述了AI客服对话分析的实践原理和实施方法,涵盖数据采集、预处理、特征提取、语义理解及可视化展示等环节。方案提供了较为详细的实施步骤,但在模型选型、特殊数据处理等方面存在不足。部署过程中,用户在数据采集对接和模型训练优化方面遇到困惑,希望获得更多实际案例和操作指导。示例代码基本可用,但在函数计算和第三方库兼容性上存在报错。总体而言,方案能满足基本对话分析需求,但需在准确性、实时性、个性化分析和结果解释性方面进一步改进。
49 1
|
6天前
|
消息中间件 存储 人工智能
《AI 大模型助力客户对话分析》解决方案评测
一文带你了解《AI 大模型助力客户对话分析》解决方案的优与劣
46 4
|
14天前
|
消息中间件 人工智能 弹性计算
《触手可及,函数计算玩转 AI 大模型》解决方案评测
一文带你了解《触手可及,函数计算玩转 AI 大模型》解决方案的优与劣
61 14
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
评测:AI 大模型助力客户对话分析
该评测报告详细介绍了Al大模型在客户对话分析中的应用,涵盖了实践原理、实施方法、部署体验、示例代码及业务适应性。报告指出,该方案利用NLP和机器学习技术,深度解析对话内容,精准识别用户意图,显著提升服务质量与客户体验。实施方法清晰明了,文档详尽,部署体验顺畅,提供了丰富的引导和支持。示例代码实用性强,但在依赖库安装和资源限制方面需注意调整。整体上,该方案能够满足基本对话分析需求,但在特定行业场景中还需进一步定制化开发。
|
2月前
|
存储 人工智能 Serverless
AI大模型助力客户对话分析评测文章
在数字化时代,企业面临客户对话数据处理的挑战。阿里云推出的AI大模型助力客户对话分析方案,通过整合多种云服务,实现对话数据的自动化分析,提升服务质量和客户体验。本文将详细介绍该方案的优势与实际应用效果。
|
2月前
|
人工智能 Serverless
参与评测「AI 大模型助力客户对话分析」
本文介绍了作者参与《AI大模型助力客户对话分析》项目的实践与感受,通过阿里云提供的解决方案,从架构设计到具体实施,最终成功部署了AI质检应用,感受到了AI技术的魅力和便捷性。项目分为四步执行,虽然过程中遇到了一些小挑战,但总体上顺利完成了部署,实现了对话记录的质检与分析,有助于提高企业客户的服务效率。
|
2月前
|
人工智能 弹性计算 自然语言处理
《触手可及,函数计算玩转 AI 大模型》解决方案体验与部署评测
在AI技术快速发展的背景下,大模型正推动各行业的智能化转型。企业为抓住机遇,纷纷寻求部署AI大模型以满足特定业务需求。阿里云函数计算凭借按量付费、卓越弹性和快速交付等优势,为企业提供了高效、安全的AI大模型部署方案。本文将详细介绍阿里云函数计算的技术解决方案及其在文生文、图像生成和语音生成等领域的应用实例,展示其在降低成本、提高效率和增强灵活性方面的显著优势。
|
2月前
|
人工智能 数据挖掘 API
评测报告:AI大模型助力客户对话分析
《AI大模型助力客户对话分析》解决方案详细介绍了如何利用AI大模型进行语音识别、情感分析和关键词提取,帮助企业提升服务质量。方案内容清晰,但部分技术细节和环境配置说明有待完善。示例代码基本可用,但在特定配置和行业术语方面需进一步优化。总体而言,该方案在实际业务场景中表现出色,但仍需改进以提升用户体验。
45 1