ACM Multimedia 2021 Watch and Buy Workshop 征稿啦, 助力开启多模态视频检索技术新篇章

简介: 10月20~24日,多媒体领域顶级会议ACM Multimedia 2021 将在成都举办,为推动直播中多模态商品检索识别的研究和AI技术在实际应用场景中的落地,阿里巴巴淘系技术与浙江大学深度合作,共同举办直播中多模态商品识别(Watch and Buy)workshop,并同步发起第二届淘宝直播商品识别大赛。目前论文投递报名中,与会者将聚焦多模态视频检索技术领域,进行深入交流与探讨。 对多媒体内

10月20~24日,多媒体领域顶级会议ACM Multimedia 2021 将在成都举办,为推动直播中多模态商品检索识别的研究和AI技术在实际应用场景中的落地,阿里巴巴淘系技术与浙江大学深度合作,共同举办直播中多模态商品识别(Watch and Buy)workshop,并同步发起第二届淘宝直播商品识别大赛。目前论文投递报名中,与会者将聚焦多模态视频检索技术领域,进行深入交流与探讨。

 

对多媒体内容中的商品进行检索和识别具有非常大经济价值和研究意义。在淘宝直播,通过直播商品识别算法,可实现淘宝直播过程中商品和直播讲解点的有效关联,让消费者可以通过点击商品跳转观看该商品的真人讲解,实现边看边买的沉浸式消费体验。目前,淘宝直播每日有数以万计的主播/直播使用该技术产品。

在实际应用中,直播中讲解商品多,视觉相似程度高,因为直播场景复杂非常高,导致讲解过程中会存在商品形变、被遮挡、模糊等情况,给直播中视觉检索识别带来巨大的技术挑战。如何利用直播画面的理解,并且有效结合主播讲解的语音、商品的标题文本描述等多模态信息,进行多模态商品检索和识别,是非常值得研究并且需持续投入的课题。

 

本次workshop举办旨在邀请来自多媒体领域的专家、学者、老师、同学,展示领域最新的研究成果,共同探讨、交流、构思新想法、新方案,推动多模态视频检索领域的技术创新研究和技术应用。Watch and Buy workshop日程为一天,将邀请海内外杰出学者和业界专家进行受邀主题报告,同时预计接收10篇海报文章,5篇口头报告文章。Workshop的详细信息参考如下:

 

workshop重要信息:

重要时间节点:

截稿:      2021 年 8月 10 日

审稿通知:2021 年 8月 26 日

终稿提交:2021 年 9月 2 日

 

投稿地址

https://sites.google.com/view/wab2021/call-for-papers 

Workshop地址

https://sites.google.com/view/wab2021

 

征稿范围

本次征稿范围包含但不限于以下的技术方向领域:

Applications of computer vision on Instance level recognition in video

Localization and open-set identification of object

Cross-modal retrieval

Video object detection and tracking techniques

Retrieval and ranking techniques

Fine-grained object recognition

Real-time deep learning inference

Multimodal analysis techniques

目录
相关文章
|
3月前
【RAPHAEL】商汤发力prompt,免费开源的图文模型!我写下了湖心亭看雪与桃花源记
【RAPHAEL】商汤发力prompt,免费开源的图文模型!我写下了湖心亭看雪与桃花源记
21 0
|
传感器 机器学习/深度学习 Web App开发
AI之Robot:机器人Robot的简介、发展历史、案例应用之详细攻略
AI之Robot:机器人Robot的简介、发展历史、案例应用之详细攻略
|
12月前
|
人工智能 达摩院 语音技术
M2MeT2.0新赛道报名启动|ASRU 2023 Special Session Challenge多通道多方会议转录挑战赛
多人对话的会议场景,由于其复杂多样的空间和声学条件,以及说话人不同的讲话风格,容易出现重叠讲话、不同数量的发言者、大会议室的远场信号以及环境噪声和混响等声音处理任务,这在语音AI技术迅速发展的当下仍是一项颇具挑战的技术难题。 为探寻更优技术解决方案,今年达摩院再次融聚产学研界专家智识,在上一届多通道多方会议转录挑战赛(M2MET)的基础上,达摩院语音实验室联合希尔贝壳和多位国内外颇具影响力的行业专家在ASRU2023上举办M2MET2.0挑战赛。
653 0
|
12月前
|
机器学习/深度学习 自动驾驶 数据挖掘
实战教程 | ECCV 2022 Out Of Distribution 分类赛道冠军方案解读
实战教程 | ECCV 2022 Out Of Distribution 分类赛道冠军方案解读
364 0
|
人工智能 监控 搜索推荐
开启AI时代,ChatGPT和Whisper API隆重登场!
ChatGPT 和 Whisper 模型现在已经可以在 OpenAI 的 API 上使用,使开发人员可以获得尖端的语言处理(不仅仅是聊天!)和语音转文本功能。通过一系列系统级别的优化,自去年 12 月以来,OpenAI 团队已经实现了 ChatGPT 的成本降低了 90%;现在正在将这些节省成本传递给 API 用户。开发人员现在可以在 API 中使用 OpenAI 开源的 Whisper large-v2 模型,获得更快速和经济实惠的结果。ChatGPT API 用户可以期待持续的模型改进,并选择专用容量以更深入地控制模型。密切听取了开发人员的反馈,并改进了 API 服务条款,以更好地满足用户
|
人工智能 自然语言处理 搜索推荐
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略(一)
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略(二)
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略(一)
|
存储 数据可视化 安全
2022云栖精选—Graph + Insight 在关联数据中发现商业价值
摘要:本文整理自蚂蚁集团数据可视化方向负责人林志峰,在云栖大会“图计算及其应用”分论坛的分享。本篇内容主要分为四个部分: 1. 大势所趋 · 技术价值和趋势 2. 生机勃勃 · 应用场景和生态 3. 厚积薄发 · 这些年的工作与沉淀 4. 浅知拙见 · 落地探索和应用实践
391 27
2022云栖精选—Graph + Insight  在关联数据中发现商业价值
|
机器学习/深度学习 人工智能 算法
|
人工智能 自然语言处理 搜索推荐
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略
DataScience&ML:金融科技领域之迁徙率(Flow Rate)表的简介、案例应用之详细攻略
DataScience&ML:金融科技领域之迁徙率(Flow Rate)表的简介、案例应用之详细攻略