阿里巴巴摘得LSVC桂冠 打造领先AI视频技术

简介: ACM MM2017的LSVC(Large-scale video classification)竞赛正式公布了本次比赛的获胜名单,来自阿里巴巴的iDST((Institute of Data Science & Technologies)团队凭借高精确性的算法顺利摘得桂冠。

近日,ACM MM2017的LSVC(Large-scale video classification)竞赛正式公布了本次比赛的获胜名单,来自阿里巴巴的iDST((Institute of Data Science & Technologies)团队凭借高精确性的算法顺利摘得桂冠。

ACM (Association for Computing Machinery ) 是一个世界性计算机从业人员的专业组织,创立于1947年,是世界上第一个科学性及教育性计算机学会。作为ACM下属的专业组织,ACM MM是国际上多媒体领域的顶级盛会。今年的LSVC竞赛便是ACM MM中的一项重要赛事,相较于其它几项竞赛,LSVC竞赛对于学术性提出了更高的要求。

据了解,阿里巴巴也将以铂金赞助商的身份参加今年10月23日在美国加州召开的ACM MM2017会议,全面展示其在多媒体领域的优秀技术。

高难度赛事登陆大视频领域 阿里顺利拔得头筹

image
LSVC比赛成功结果,第一名由阿里巴巴iDST团队获得

本次挑战赛主要面向从事Video Analysis的研发人员,主要考验大规模视频数据处理能力以及分类算法的性能,吸引了20余支顶级团队参与其中。竞赛中,LSVC为参赛团队提供了约62000份涉及500个类目的未裁剪视频以及预提取的特征作为训练集,约15000个视频作为验证集,在测试集中,LSVC则为参赛者准备了超过78000份保留ground truth的未裁剪视频。

竞赛采用mAP作为评判标准,评审根据参赛团队提交的测试集上预测的各个label的Probability,对其成功性进行验证,最终选出获胜者。阿里巴巴iDST团队以高于第二名0.366个百分点的优势摘得第一。

在竞赛中,阿里巴巴借助阿里云大数据计算服务ODPS提取了8个不同模态的特征,这些模态用不同的数据库预训练,涵盖了物体、场景、动作、语音等维度的信息。实验表明,丰富的模态信息对于大规模视频分类起到了关键作用,iDST团队得到的最好单模型融合了六个模态,在验证集上达到0.8485 mAP。这套算法部署在视频服务平台VENUS(VidEo aNalysis and Understaing System),用以视频分类标签提取任务。

AI领域斩获多项成果 志在引领科技变革

阿里巴巴在本次LSVC竞赛中所取得优异成绩也体现了其在大视频处理技术以及AI领域的领先优势。在人工智能领域的顶级会议中,阿里巴巴也可谓硕果累累。在今年的国际人工智能联合会议(IJCAI)上,阿里巴巴共有11篇论文入选,而在计算机视觉领域全球最有影响力、内容最全面的顶级学术会议CVPR上,阿里巴巴iDST和 AI LAB也有多篇论文被收录。

今年3月,阿里巴巴推出NASA计划,面向未来20年组建强大的独立研发机构,为服务近20亿人的新经济体储备核心科技。为实现该目标,一方面由金榕、华先胜、任小枫等技术领军人物,组建iDST、AI Labs等研究机构;另一方面发布首个全球性科研项目“AIR”计划,推进计算机科学领域基础性、前瞻性、突破性的研究,构建技术生态。现在的阿里巴巴正从“互联网+模式”的商业模式创新引领者,转变成科技创新的引领者。

来源:阿里技术
原文链接

相关文章
|
6天前
|
机器学习/深度学习 人工智能 API
Aligner:自动修正AI的生成结果,北大推出残差修正模型对齐技术
介绍北大团队提出的 Aligner 模型对齐技术,通过学习对齐答案与未对齐答案之间的修正残差,提升大语言模型的性能。
65 28
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
VideoWorld 是由字节跳动、北京交通大学和中国科学技术大学联合推出的自回归视频生成模型,能够从未标注的视频数据中学习复杂知识,支持长期推理和规划任务。
134 8
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
|
1天前
|
存储 人工智能 Serverless
一键解锁 AI 动画视频创作,赢好礼
短视频行业的快速增长使得内容创作的速度和质量成为竞争关键。传统动画故事制作复杂且昂贵,限制了创作者对市场热点的快速反应和创新实现。本方案通过 AI 生成剧本和动画,简化创作流程并降低技术门槛,使创作者能高效生产高质量作品,迅速适应市场需求。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
DeepSeek逆天,核心是 知识蒸馏(Knowledge Distillation, KD),一项 AI 领域的关键技术
尼恩架构团队推出《LLM大模型学习圣经》系列,涵盖从Python开发环境搭建到精通Transformer、LangChain、RAG架构等核心技术,帮助读者掌握大模型应用开发。该系列由资深架构师尼恩指导,曾助力多位学员获得一线互联网企业的高薪offer,如网易的年薪80W大模型架构师职位。配套视频将于2025年5月前发布,助你成为多栖超级架构师。此外,尼恩还提供了NIO、Docker、K8S等多个技术领域的学习圣经PDF,欢迎领取完整版资源。
|
1天前
|
人工智能 安全 机器人
重磅发布的「AI视频通话」如何10分钟就实现?
2024年,OpenAI发布GPT-4o,支持文本、音频和图像的组合输入与输出,使交互更接近自然交流。传统语音助手需经历多阶段处理,容易出现延迟或误解,体验感差。本文介绍如何在阿里云上快速创建可视频通话的AI智能体,实现拟人化交互、精准感知、情绪捕捉等功能,提供高质量、低延时的音视频通话体验。通过简单的部署流程,用户可以轻松创建并体验这一先进的人机交互技术。点击“阅读原文”参与活动赢取惊喜礼物。
|
22小时前
|
机器学习/深度学习 存储 人工智能
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用,支持多模态交互、多种主流模型选择、离线运行及性能优化。
95 13
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
|
17天前
|
存储 人工智能 安全
AI时代的网络安全:传统技术的落寞与新机遇
在AI时代,网络安全正经历深刻变革。传统技术如多因素身份认证、防火墙和基于密码的系统逐渐失效,难以应对新型攻击。然而,AI带来了新机遇:智能化威胁检测、优化安全流程、生物特征加密及漏洞管理等。AI赋能的安全解决方案大幅提升防护能力,但也面临数据隐私和技能短缺等挑战。企业需制定清晰AI政策,强化人机协作,推动行业持续发展。
49 16
|
18天前
|
机器学习/深度学习 存储 人工智能
AI实践:智能工单系统的技术逻辑与应用
智能工单系统是企业服务管理的核心工具,通过多渠道接入、自然语言处理等技术,实现工单自动生成、分类和分配。它优化了客户服务流程,提高了效率与透明度,减少了运营成本,提升了客户满意度。系统还依托知识库和机器学习,持续改进处理策略,助力企业在竞争中脱颖而出。
56 5
|
24天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。

热门文章

最新文章