ACM Multimedia 2021 Watch and Buy Workshop 征稿啦, 助力开启多模态视频检索技术新篇章

简介: 10月20~24日,多媒体领域顶级会议ACM Multimedia 2021 将在成都举办,为推动直播中多模态商品检索识别的研究和AI技术在实际应用场景中的落地,阿里巴巴淘系技术与浙江大学深度合作,共同举办直播中多模态商品识别(Watch and Buy)workshop,并同步发起第二届淘宝直播商品识别大赛。目前论文投递报名中,与会者将聚焦多模态视频检索技术领域,进行深入交流与探讨。 对多媒体内

10月20~24日,多媒体领域顶级会议ACM Multimedia 2021 将在成都举办,为推动直播中多模态商品检索识别的研究和AI技术在实际应用场景中的落地,阿里巴巴淘系技术与浙江大学深度合作,共同举办直播中多模态商品识别(Watch and Buy)workshop,并同步发起第二届淘宝直播商品识别大赛。目前论文投递报名中,与会者将聚焦多模态视频检索技术领域,进行深入交流与探讨。

 

对多媒体内容中的商品进行检索和识别具有非常大经济价值和研究意义。在淘宝直播,通过直播商品识别算法,可实现淘宝直播过程中商品和直播讲解点的有效关联,让消费者可以通过点击商品跳转观看该商品的真人讲解,实现边看边买的沉浸式消费体验。目前,淘宝直播每日有数以万计的主播/直播使用该技术产品。

在实际应用中,直播中讲解商品多,视觉相似程度高,因为直播场景复杂非常高,导致讲解过程中会存在商品形变、被遮挡、模糊等情况,给直播中视觉检索识别带来巨大的技术挑战。如何利用直播画面的理解,并且有效结合主播讲解的语音、商品的标题文本描述等多模态信息,进行多模态商品检索和识别,是非常值得研究并且需持续投入的课题。

 

本次workshop举办旨在邀请来自多媒体领域的专家、学者、老师、同学,展示领域最新的研究成果,共同探讨、交流、构思新想法、新方案,推动多模态视频检索领域的技术创新研究和技术应用。Watch and Buy workshop日程为一天,将邀请海内外杰出学者和业界专家进行受邀主题报告,同时预计接收10篇海报文章,5篇口头报告文章。Workshop的详细信息参考如下:

 

workshop重要信息:

重要时间节点:

截稿:      2021 年 8月 10 日

审稿通知:2021 年 8月 26 日

终稿提交:2021 年 9月 2 日

 

投稿地址

https://sites.google.com/view/wab2021/call-for-papers 

Workshop地址

https://sites.google.com/view/wab2021

 

征稿范围

本次征稿范围包含但不限于以下的技术方向领域:

Applications of computer vision on Instance level recognition in video

Localization and open-set identification of object

Cross-modal retrieval

Video object detection and tracking techniques

Retrieval and ranking techniques

Fine-grained object recognition

Real-time deep learning inference

Multimodal analysis techniques

目录
相关文章
|
人工智能 编解码 自然语言处理
上交大&上海AI lab研发胸部X-ray疾病诊断基础模型,成果入选Nature子刊
上交大&上海AI lab研发胸部X-ray疾病诊断基础模型,成果入选Nature子刊
242 0
|
人工智能 自然语言处理 搜索推荐
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略(一)
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略(二)
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略(一)
|
机器学习/深度学习 存储 数据采集
7 Papers & Radios | 谷歌开源机器人领域transformer;DeepMind推出剧本写作AI
7 Papers & Radios | 谷歌开源机器人领域transformer;DeepMind推出剧本写作AI
318 0
|
机器学习/深度学习 Web App开发 人工智能
全球名校AI课程库(7)| Berkeley伯克利 · 深度神经网络设计、可视化与理解课程『Deep Learning: Designing, Visualizing and Understand』
课程以深度学习的典型方法、模型设计、可视化与模型理解为主题,讲解了自然语言处理、计算机视觉、强化学习等领域的AI模型全域知识。
2201 1
全球名校AI课程库(7)| Berkeley伯克利 · 深度神经网络设计、可视化与理解课程『Deep Learning: Designing, Visualizing and Understand』
|
机器学习/深度学习 人工智能 算法
|
人工智能 自然语言处理 搜索推荐
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略
AI之HCI:人机交互Human-Computer Interaction的简介、发展历史、案例应用之详细攻略
|
编解码 人工智能 前端开发
Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读
Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读
Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读
AI:2020年6月22日北京智源大会演讲分享之认知神经基础专题论坛——14:20-15:00方方教授《Maps and Functions of Human Attention》
AI:2020年6月22日北京智源大会演讲分享之认知神经基础专题论坛——14:20-15:00方方教授《Maps and Functions of Human Attention》
AI:2020年6月22日北京智源大会演讲分享之认知神经基础专题论坛——14:20-15:00方方教授《Maps and Functions of Human Attention》
AI:2020年6月24日北京智源大会演讲分享之知识智能专题论坛——12:30-13:10Jure《Recent Advancements in Graph Neural Networks》
AI:2020年6月24日北京智源大会演讲分享之知识智能专题论坛——12:30-13:10Jure《Recent Advancements in Graph Neural Networks》
AI:2020年6月24日北京智源大会演讲分享之知识智能专题论坛——12:30-13:10Jure《Recent Advancements in Graph Neural Networks》
AI:2020年6月22日北京智源大会演讲分享之11:30-12:20Jorge教授《Zero-Order Optimization Methods with Applications to RL》
AI:2020年6月22日北京智源大会演讲分享之11:30-12:20Jorge教授《Zero-Order Optimization Methods with Applications to RL》
AI:2020年6月22日北京智源大会演讲分享之11:30-12:20Jorge教授《Zero-Order Optimization Methods with Applications to RL》

热门文章

最新文章