10月20~24日,多媒体领域顶级会议ACM Multimedia 2021 将在成都举办,为推动直播中多模态商品检索识别的研究和AI技术在实际应用场景中的落地,阿里巴巴淘系技术与浙江大学深度合作,共同举办直播中多模态商品识别(Watch and Buy)workshop,并同步发起第二届淘宝直播商品识别大赛。目前论文投递报名中,与会者将聚焦多模态视频检索技术领域,进行深入交流与探讨。
对多媒体内容中的商品进行检索和识别具有非常大经济价值和研究意义。在淘宝直播,通过直播商品识别算法,可实现淘宝直播过程中商品和直播讲解点的有效关联,让消费者可以通过点击商品跳转观看该商品的真人讲解,实现边看边买的沉浸式消费体验。目前,淘宝直播每日有数以万计的主播/直播使用该技术产品。
在实际应用中,直播中讲解商品多,视觉相似程度高,因为直播场景复杂非常高,导致讲解过程中会存在商品形变、被遮挡、模糊等情况,给直播中视觉检索识别带来巨大的技术挑战。如何利用直播画面的理解,并且有效结合主播讲解的语音、商品的标题文本描述等多模态信息,进行多模态商品检索和识别,是非常值得研究并且需持续投入的课题。
本次workshop举办旨在邀请来自多媒体领域的专家、学者、老师、同学,展示领域最新的研究成果,共同探讨、交流、构思新想法、新方案,推动多模态视频检索领域的技术创新研究和技术应用。Watch and Buy workshop日程为一天,将邀请海内外杰出学者和业界专家进行受邀主题报告,同时预计接收10篇海报文章,5篇口头报告文章。Workshop的详细信息参考如下:
workshop重要信息:
重要时间节点:
截稿: 2021 年 8月 10 日
审稿通知:2021 年 8月 26 日
终稿提交:2021 年 9月 2 日
投稿地址
https://sites.google.com/view/wab2021/call-for-papers
Workshop地址
https://sites.google.com/view/wab2021
征稿范围
本次征稿范围包含但不限于以下的技术方向领域:
Applications of computer vision on Instance level recognition in video
Localization and open-set identification of object
Cross-modal retrieval
Video object detection and tracking techniques
Retrieval and ranking techniques
Fine-grained object recognition
Real-time deep learning inference
Multimodal analysis techniques