备案控制台

开发者社区雷锋网文章正文

看过10万个视频 AI才能识别你的脑残操作

2017-10-24 1129

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本期论文提出：想要通过建立视频数据库来提升算法性能，那么这个数据库需要包含大量行为事件（包括：移动、捡起、抬举、抬举、击刺、投掷、倾倒、接入等等），从而让AI能够区分，人们到底是在执行什么逆天操作。

本期论文提出：想要通过建立视频数据库来提升算法性能，那么这个数据库需要包含大量行为事件（包括：移动、捡起、抬举、抬举、击刺、投掷、倾倒、接入等等），从而让AI能够区分，人们到底是在执行什么逆天操作。

看过10万个视频 AI才能识别你的脑残操作 | 2分钟读论文

此前这类数据集极少。但在最新发布的数据集中，有10万个贴有标签的视频可供学习。

看过10万个视频 AI才能识别你的脑残操作 | 2分钟读论文

如何通过视频数据库来提升视觉学习能力？戳下方视频了解详情。

▷观看论文解读大概需要 3 分钟

学霸们还请自行阅读论文以获得更多细节

论文原址：https://arxiv.org/abs/1706.04261

雷锋网AI研习社出品系列短视频《 2 分钟论文》，带大家用碎片时间阅览前沿技术，了解 AI 领域的最新研究成果。欢迎关注雷锋网(公众号：雷锋网)雷锋字幕组专栏，获得更多AI知识~感谢志愿者对本期内容作出贡献。

看过10万个视频 AI才能识别你的脑残操作 | 2分钟读论文

本文作者：雷锋字幕组

本文转自雷锋网禁止二次转载，原文链接

文章标签：

媒体处理

数据库

算法

人工智能

关键词：

AI视频

AI识别

AI操作

视频AI识别

玄学酱

目录

相关文章

技术小达人

|

8天前

|

机器学习/深度学习人工智能算法

【AI问爱答-双十一返场周】第二场企业办公视频

【AI问爱答-双十一返场周】探讨AI大模型时代对企业办公的影响。AI员工旨在辅助而非替代人类，通过深度学习、大规模训练数据和自我监督学习提升效率。视频介绍生成式智能工具如全妙系列，助力企业内容生产。关注AI问爱答，了解更多AI技术与应用。

技术小达人

20 5 5

蚝油菜花

|

1天前

|

机器学习/深度学习人工智能自然语言处理

VideoWorld：字节开源自回归视频生成模型，支持输入视频指导AI生成视频！弥补文本生成视频的短板

VideoWorld 是由字节跳动、北京交通大学和中国科学技术大学联合推出的自回归视频生成模型，能够从未标注的视频数据中学习复杂知识，支持长期推理和规划任务。

蚝油菜花

41 8 8

VideoWorld：字节开源自回归视频生成模型，支持输入视频指导AI生成视频！弥补文本生成视频的短板

蚝油菜花

|

2天前

|

人工智能编解码

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，支持文生视频、图生视频，最高支持4K分辨率，广泛应用于内容创作、教育、广告等领域。

蚝油菜花

28 5 5

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

蚝油菜花

|

8天前

|

机器学习/深度学习人工智能自然语言处理

Emotion-LLaMA：用 AI 读懂、听懂、看懂情绪，精准捕捉文本、音频和视频中的复杂情绪

Emotion-LLaMA 是一款多模态情绪识别与推理模型，融合音频、视觉和文本输入，通过特定情绪编码器整合信息，广泛应用于人机交互、教育、心理健康等领域。

蚝油菜花

69 11 12

Emotion-LLaMA：用 AI 读懂、听懂、看懂情绪，精准捕捉文本、音频和视频中的复杂情绪

蚝油菜花

|

2天前

|

人工智能自然语言处理搜索推荐

GLM-Realtime：智谱推出多模态交互AI模型，融入清唱功能，支持视频和语音交互

GLM-Realtime 是智谱推出的端到端多模态模型，具备低延迟的视频理解与语音交互能力，支持清唱功能、2分钟内容记忆及灵活调用外部工具，适用于多种智能场景。

蚝油菜花

23 4 4

GLM-Realtime：智谱推出多模态交互AI模型，融入清唱功能，支持视频和语音交互

蚝油菜花

|

21天前

|

机器学习/深度学习人工智能编解码

VideoVAE+：AI 生成视频高保真重建和跨模态重建工具，基于文本信息指导视频重建，提升视频细节质量

VideoVAE+ 是香港科技大学推出的先进跨模态视频变分自编码器，通过时空分离压缩机制和文本指导，实现了高效视频压缩与精准重建。

蚝油菜花

74 7 7

VideoVAE+：AI 生成视频高保真重建和跨模态重建工具，基于文本信息指导视频重建，提升视频细节质量

六月的雨在钉钉

|

8天前

|

人工智能搜索推荐

AI视频技术的发展是否会影响原创内容的价值

AI视频技术的发展显著降低了视频制作的门槛与成本，自动完成剪辑、特效添加等繁琐工作，大大缩短创作时间。它提供个性化创意建议，帮助创作者突破传统思维，拓展创意边界。此外，AI技术使更多非专业人士也能参与视频创作，注入新活力与多样性，丰富了原创内容。总体而言，AI视频技术不仅提升了创作效率，还促进了视频内容的创新与多样化。

六月的雨在钉钉

34 15 15

蚝油菜花

|

23天前

|

机器学习/深度学习人工智能算法

Enhance-A-Video：上海 AI Lab 推出视频生成质量增强算法，显著提升 AI 视频生成的真实度和细节表现

Enhance-A-Video 是由上海人工智能实验室、新加坡国立大学和德克萨斯大学奥斯汀分校联合推出的视频生成质量增强算法，能够显著提升视频的对比度、清晰度和细节真实性。

蚝油菜花

69 8 8

Enhance-A-Video：上海 AI Lab 推出视频生成质量增强算法，显著提升 AI 视频生成的真实度和细节表现

蚝油菜花

|

1月前

|

人工智能

AniDoc：蚂蚁集团开源 2D 动画上色 AI 模型，基于视频扩散模型自动将草图序列转换成彩色动画，保持动画的连贯性

AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型，能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略，实现了色彩和风格的准确传递，适用于动画制作、游戏开发和数字艺术创作等多个领域。

蚝油菜花

107 16 16

AniDoc：蚂蚁集团开源 2D 动画上色 AI 模型，基于视频扩散模型自动将草图序列转换成彩色动画，保持动画的连贯性

技术小达人

|

8天前

|

人工智能自然语言处理机器人

【AI问爱答-双十一返场周】第一场营销电商视频

【AI问爱答-双十一返场周】第一场营销电商视频聚焦双11期间京东电商与营销领域的AI应用。本期探讨大语言模型、Stable Diffusion等技术，介绍PAI工具如何简化AI应用搭建，并邀请中科深智CEO成维忠分享数字人技术在直播带货中的成功案例。关注AI问爱答，扫码了解更多AI技术和促销内容。

技术小达人

22 6 6

雷锋网

热门文章

最新文章

通义灵码2.0全新升级，AI程序员全面开放使用

1月更文特别场——寻找用云高手，分享云&AI实践

阿里云先知安全沙龙(武汉站) ——AI赋能软件漏洞检测，机遇, 挑战与展望

【科普向】我们所说的AI模型训练到底在训练什么？

Paimon 1.0: Unified Lake Format for Data + AI

阿里云百炼xWaytoAGI共学课开课：手把手学AI，大咖带你从零搭建AI应用

AI辅助的运维流程自动化：实现智能化管理的新篇章

Spring AI Alibaba + 通义千问，开发AI应用如此简单！！！

Qwen-Agent：阿里通义开源 AI Agent 应用开发框架，支持构建多智能体，具备自动记忆上下文等能力

与 AI 智能体来一场“春节互动”

《AI 剧本生成与动画创作》解决方案测评报告

AI实践：智能工单系统的技术逻辑与应用

百聆：集成Deepseek API及语音技术的开源AI语音对话助手，实时交互延迟低至800ms

GLM-Realtime：智谱推出多模态交互AI模型，融入清唱功能，支持视频和语音交互

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

Zerox：AI驱动的万能OCR工具，精准识别复杂布局并输出Markdown格式，支持PDF、DOCX、图片等多种文件格式

CogView-3-Flash：智谱首个免费AI图像生成模型，支持多种分辨率，快速生成创意图像

AI 工程学习 - 三张图说明白什么是 RAG

AI时代下的数据信息提取 | 多模态数据信息提取

AI赋能运维：实时警报管理的新时代

相关课程

更多

AIGC无处不在，把AI应用构建于Serverless之上

【科技少年】AI领航员探索教程（赛前训练）

达摩院视觉AI精品课

AI开发者的Docker实践

趣味视觉AI应用入门与实战

相关电子书

更多

AI医健中台技术进展及生态发展

阿里视觉AI开放之路：从公共云走向端云协同

达摩院工业视觉AI见微生态认证与培训计划

相关实验场景

更多

体育赛事！零代码生成运动风格AI写真。

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

使用容器计算服务 ACS 算力快速搭建生成式 AI 会话应用

SAE 极速部署专属 AI 证件照神器

流水线运行出错排查难？AI帮你智能排查

以电商场景为例搭建AI语义搜索应用

下一篇

阿里云oss简介和如何对接使用