「镁客·请讲」慧川智能康洪文:打造一个“AI+视频云平台”的中央厨房

简介: 同样是视频制作,但慧川智能却想要从根源处进行突破,将制作主体由人变为AI。

同样是视频制作,但慧川智能却想要从根源处进行突破,将制作主体由人变为AI。

眼下,以抖音、快手、梨视频为主要代表的短视频领域逐渐崛起。有数据显示,2017年短视频市场规模达57.3亿,同比增长达183.9%,预计到2020年,这一市场规模将超过300亿。

有市场就代表有需求,但需要注意的是,虽说是“短”视频,但制作时间并不短。一般情况下,短视频的时长为10到60秒,跳过策划和拍摄的过程,仅剪辑就需要花费数十分钟甚至数个小时的时间。显然,随着这一市场需求的逐渐增加,这个速度将越来越跟不上脚步。

为了解决这个问题,有人意图用AI手段。

打破常规,他要从第一步比那个视频制作方法

为了制作一个真正合格的视频,我们首先要做的就是收集需要的素材,然后将这些素材进行剪切、编辑,包括添加过渡效果、添加字幕、处理声音效果等等,最后生成视频文件。

但是,现在有不少人正在寻求“打破常规”,这其中就包括康洪文。自2004年进入微软亚洲研究院,后又赴美国卡耐基梅隆大学攻读人工智能、计算机博士,10几年来,他一直在围绕视频做AI研究。现如今,他的身份是AI创企慧川智能的创始人兼CEO。

TB1VqVAuwHqK1RjSZJnXXbNLpXa.jpg

图 | 慧川智能创始人兼CEO康洪文

在应用商店内进行搜索,用于视频制作的软件现在想必不少,但是,它们在做法上并没有脱离于常规。在这一点上,慧川智能的“智影”则提出了一种新思路,通过云平台接入分散的视频素材和分散的剪辑师,通过自动化标签、自动模块化包装、智能字幕、自动配音等AI技术提升在线视频制作效能,甚至能够基于自然语言处理等AI技术将脚本文字快速转化为短视频。

届时,用账号登录“智影”官网之后,用户只需要一篇文章、一个链接或者一个关键词,平台即能够从素材库中自动搜索合适的图片或视频素材,并借由人工智能合成语音、配备字幕、贴图花字包装和背景音乐等,最终完成一条短视频的制作。“我们要打造的是一个‘AI+视频云平台’的中央厨房。”康洪文表示。

TB1DRFAuAPoK1RjSZKbXXX1IXXa.png

如此一来,即使是小白用户,也可以在极短时间内完成一个短视频的制作,而不需再去辛苦学习如何用PR、AE等视频制作软件。

当前,智影已经接入了梨视频、新京报、腾讯新闻、秒拍、湖南卫视等多家客户平台。与个人用户不同,这类平台一般会存在庞大的拍客群体,并为产品配备一个编辑团队,前者提供视频素材,后者根据某一主题编辑过后再发布至平台。然而,伴随着短视频等市场的崛起,最多仅有数百人规模的编辑团队已经不足以应付上万拍客的海量素材剪辑。如今,借由“智影”平台,面对大量的素材,编辑团队可一站式完成从素材的搜集、视频的初剪、精剪、后期包装、渲染导出和发布。

做垂直领域创业,不担心BAT的狙击

现如今,根据相关数据统计,自2000年以来,活跃的人工智能创业公司的数量增加了14倍。在这其中,有基于技术致力于打造平台的大公司,也有专注于做独立软件或硬件的小公司。

事实上,在计算机视觉、智能语音技术等领域,多数市场份额已经被一些“头部企业”所包揽。这时候,新入局者首先需要考虑的问题是,如何避免与他们的直面竞争?面对这个问题,许多人的解决方案是“另辟蹊径”,就比如慧川智能,同样是做计算机视觉、智能语音技术,但却将之进行糅合,并选定“AI+视频制作”这一鲜少有人能够想到的方向。

“最开始的时候,其实我们也比较担心,像BAT等等,他们在财力物力等方面远超于我们。”康洪文表示。“不过,越到后面,我们越发现,这个事情做起来远比想象复杂。我们也使用过国内顶级互联网公司的云服务,但是最后发现上面的技术已经远远不能满足我们的需求。”

TB1JcdvurPpK1RjSZFFXXa5PpXa.png

不可否认,在这一块,诸如BAT等致力于打造技术&应用平台的公司,虽然技术和应用的覆盖面非常广,但多数时候并不能做到垂直和深入。在这里,平台会提供各类API接口,而如果要真正的做出一款适合自己的产品,还需要开发者进行再开发。

也因此,这也给那些垂直于某一行业的初创公司留下了喘息的机会。

“当发现国内外一些解决方案并不能满足我们的需求之后,我们开始独立研发技术,走过许多坑坑洼洼,目前积累了许多。在线智能化视频制作技术这一块,我们已经走在了世界前沿。”

最后

在今年7月份的时候,慧川智能已经完成了数千万人民币的Pre-A轮融资,由知名投资人曹国熊和知名财经作家吴晓波共同发起的头头是道基金独家出资。

眼下,基于智影这一平台,慧川智能已经能够实现一个正常的现金流。也因此,对于下一轮融资的启动,慧川智能定没有那么的“着急”,康洪文也表示暂时还没有特别明确的计划。

此外,虽然垂直于“AI+视频”这一领域,但对于未来的规划,康洪文并不满足于此。在其看来,“在监控、工业视觉、医疗等领域,我们的技术也可以做到物体识别、图像分类等等,相当于把‘AI+视频’这个部分进行拆解,去更为细分的应用场景内打磨和应用技术。”

【镁客·请讲】专注于报道科技创新项目;我们敞开心扉面对每一位创业者,力求为您呈现一群鲜活、有性格的品牌和人物;我们倾听创业故事和人生经历、探讨商业模式和行业趋势、对接资本市场和供需双方,以期为产业发展注入新的活力。

欢迎做客【镁客·请讲】,栏目合作请发送邮件至:post@im2maker.com

相关文章
|
2天前
|
人工智能 移动开发 前端开发
WeaveFox:蚂蚁集团推出 AI 前端智能研发平台,能够根据设计图直接生成源代码,支持多种客户端和技术栈
蚂蚁团队推出的AI前端研发平台WeaveFox,能够根据设计图直接生成前端源代码,支持多种应用类型和技术栈,提升开发效率和质量。本文将详细介绍WeaveFox的功能、技术原理及应用场景。
186 66
WeaveFox:蚂蚁集团推出 AI 前端智能研发平台,能够根据设计图直接生成源代码,支持多种客户端和技术栈
|
2天前
|
人工智能
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型,能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略,实现了色彩和风格的准确传递,适用于动画制作、游戏开发和数字艺术创作等多个领域。
42 16
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
|
13天前
|
机器学习/深度学习 人工智能 UED
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是一款开源的AI虚拟试衣工具,能够智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。该工具支持半身和全身试穿模式,操作简单,适合服装电商、时尚行业从业者及AI试穿技术爱好者使用。
101 27
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
|
5天前
|
人工智能 数据可视化 JavaScript
NodeTool:AI 工作流可视化构建器,通过拖放节点设计复杂的工作流,集成 OpenAI 等多个平台
NodeTool 是一个开源的 AI 工作流可视化构建器,通过拖放节点的方式设计复杂的工作流,无需编码即可快速原型设计和测试。它支持本地 GPU 运行 AI 模型,并与 Hugging Face、OpenAI 等平台集成,提供模型访问能力。
46 14
NodeTool:AI 工作流可视化构建器,通过拖放节点设计复杂的工作流,集成 OpenAI 等多个平台
|
13天前
|
机器学习/深度学习 Web App开发 人工智能
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
Amurex是一款开源的AI会议助手,提供实时建议、智能摘要、快速回顾关键信息等功能,帮助用户提升会议效率。本文将详细介绍Amurex的功能、技术原理以及如何运行和使用该工具。
68 18
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
|
7天前
|
人工智能 数据库 自然语言处理
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
「拥抱Data+AI」系列文章由阿里云瑶池数据库推出,基于真实客户案例,展示Data+AI行业解决方案。本文通过钉钉AI助理的实际应用,探讨如何利用阿里云Data+AI解决方案实现智能问数服务,使每个人都能拥有专属数据分析师,显著提升数据查询和分析效率。点击阅读详情。
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
|
12天前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
74 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
MMAudio 是一个基于多模态联合训练的高质量 AI 音频合成项目,能够根据视频内容或文本描述生成同步的音频。该项目适用于影视制作、游戏开发、虚拟现实等多种场景,提升用户体验。
56 7
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
|
5天前
|
传感器 机器学习/深度学习 人工智能
AI视频监控卫士技术介绍:智能化河道管理解决方案
AI视频监控卫士系统,通过高清摄像头、智能传感器和深度学习技术,实现河道、水库、城市水务及生态保护区的全天候、全覆盖智能监控。系统能够自动识别非法行为、水质变化和异常情况,并实时生成警报,提升管理效率和精准度。
37 13
|
6天前
|
人工智能 小程序 API
【一步步开发AI运动小程序】十七、如何识别用户上传视频中的人体、运动、动作、姿态?
【云智AI运动识别小程序插件】提供人体、运动、姿态检测的AI能力,支持本地原生识别,无需后台服务,具有速度快、体验好、易集成等优点。本文介绍如何使用该插件实现用户上传视频的运动识别,包括视频解码抽帧和人体识别的实现方法。

热门文章

最新文章