DeepMind前成员推出Haiper:AI视频生成赛道再添新势力

简介: 【2月更文挑战第16天】DeepMind前成员推出Haiper:AI视频生成赛道再添新势力

92ac2b1d0cec1697512a723591c9bf8b.jpeg
在人工智能的快速发展浪潮中,视频内容的生成技术正逐渐成为新的研究热点。近期,这一领域迎来了一位新的竞争者——Haiper,由DeepMind的两位前成员易树和王子宇共同创立。他们的公司专注于开发先进的视频生成工具,这一技术的推出,预示着AI视频生成领域的竞争格局将更加多元和激烈。

Haiper的成立并非偶然,它的前身是一个专注于AI 3D建模的项目。然而,在深入研究和市场调研后,易树和王子宇发现视频生成技术具有更广阔的应用前景和市场需求。因此,他们决定调整方向,专注于视频内容的AI生成技术,并在2022年正式成立了Haiper公司。

Haiper的技术实力得到了资本市场的认可。在种子轮融资中,Haiper成功吸引了Octopus Ventures等知名投资机构的青睐,共筹集了1380万美元。此外,公司还在2022年4月获得了由杰弗里·辛顿等天使投资者支持的540万美元的种子前轮融资。这些资金的注入,为Haiper的研发和市场推广提供了坚实的基础。

Haiper的官方网站提供了一项创新的服务:用户可以通过简单的文本输入,免费生成视频。这项服务目前能够生成最长两秒的高清视频,以及质量稍低的四秒视频。这一服务的推出,降低了视频内容创作的门槛,使得普通用户也能够轻松制作出专业级别的视频内容。此外,Haiper还提供了图像动画化和视频风格转换等附加功能,进一步丰富了用户的创作体验。

尽管Haiper目前专注于面向消费者的服务,但公司的愿景远不止于此。易树和王子宇希望构建一个核心视频生成模型,这个模型不仅能够服务于普通用户,还能够为开发者和企业提供强大的技术支持。目前,Haiper已经私下接触了一些开发者,邀请他们测试封闭的API,并期待通过他们的反馈来优化产品。未来,Haiper甚至可能考虑开源其模型,以促进更广泛的应用探索。

Haiper的团队正在迅速扩张,目前约有20名员工,并正在积极招聘工程和营销领域的人才。在AI视频生成领域,Haiper面临着来自OpenAI的Sora等强劲对手的挑战。同时,Google和Nvidia支持的Runway、Google和Meta以及Stability AI等公司也在这一领域拥有自己的视频生成模型。这些竞争者的存在,无疑为Haiper的发展带来了压力,但同时也激发了团队的创新潜力。

Haiper的创始人易树和王子宇都拥有牛津大学机器学习方向的博士学位,并在业界积累了丰富的经验。他们的专业背景和技术经验为Haiper的发展提供了坚实的支撑。易树曾在TikTok的全球信任与安全团队工作,而王子宇则在谷歌和DeepMind担任过研究科学家。他们的这些经历,使得Haiper在技术研究和产品开发上具有先天的优势。

Haiper的推出,不仅为AI视频生成领域带来了新的活力,也为用户和开发者提供了新的工具和可能性。随着技术的不断进步和市场的扩大,Haiper有望在AI视频生成领域占据一席之地,并推动整个行业的发展。无论是对于内容创作者、企业还是普通用户,Haiper的出现都预示着更多的可能性和机遇。

目录
相关文章
|
1天前
|
人工智能
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型,能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略,实现了色彩和风格的准确传递,适用于动画制作、游戏开发和数字艺术创作等多个领域。
30 16
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
|
11天前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
74 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
MMAudio 是一个基于多模态联合训练的高质量 AI 音频合成项目,能够根据视频内容或文本描述生成同步的音频。该项目适用于影视制作、游戏开发、虚拟现实等多种场景,提升用户体验。
53 7
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
|
17天前
|
人工智能 编解码 网络架构
GenCast:谷歌DeepMind推出的AI气象预测模型
GenCast是由谷歌DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。该模型在97.2%的预测任务中超越了全球顶尖的中期天气预报系统ENS,尤其在极端天气事件的预测上表现突出。GenCast能在8分钟内生成预报,显著提高预测效率,并且已经开源,包括代码和模型权重,支持更广泛的天气预报社区和研究。
111 14
GenCast:谷歌DeepMind推出的AI气象预测模型
|
18天前
|
机器学习/深度学习 存储 人工智能
EfficientTAM:Meta AI推出的视频对象分割和跟踪模型
EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,旨在解决SAM 2模型在移动设备上部署时的高计算复杂度问题。该模型采用非层次化Vision Transformer(ViT)作为图像编码器,并引入高效记忆模块,以降低计算复杂度,同时保持高质量的分割结果。EfficientTAM在多个视频分割基准测试中表现出与SAM 2相当的性能,具有更快的处理速度和更少的参数,特别适用于移动设备上的视频对象分割应用。
36 9
EfficientTAM:Meta AI推出的视频对象分割和跟踪模型
|
5天前
|
人工智能 小程序 API
【一步步开发AI运动小程序】十七、如何识别用户上传视频中的人体、运动、动作、姿态?
【云智AI运动识别小程序插件】提供人体、运动、姿态检测的AI能力,支持本地原生识别,无需后台服务,具有速度快、体验好、易集成等优点。本文介绍如何使用该插件实现用户上传视频的运动识别,包括视频解码抽帧和人体识别的实现方法。
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
LTX Video:Lightricks推出的开源AI视频生成模型
LTX Video是由Lightricks推出的开源AI视频生成模型,能够在4秒内生成5秒的高质量视频。该模型基于2亿参数的DiT架构,确保帧间平滑运动和结构一致性,支持长视频制作,适用于多种场景,如游戏图形升级和电子商务广告变体制作。
88 1
LTX Video:Lightricks推出的开源AI视频生成模型
存储 人工智能 自然语言处理
48 6
|
2月前
|
人工智能 编解码 API
【选择”丹摩“深入探索智谱AI的CogVideoX:视频生成的新前沿】
【选择”丹摩“深入探索智谱AI的CogVideoX:视频生成的新前沿】
|
3月前
|
人工智能 安全 算法
5年数据观巨变,这家公司如何在AI和大模型数据赛道遥遥领先?
5年数据观巨变,这家公司如何在AI和大模型数据赛道遥遥领先?
118 12
下一篇
DataWorks