HappyHorse(官方译名:快乐小马 / 欢乐马)是阿里巴巴 ATH 创新事业部主导研发的原生多模态 AI 视频生成大模型,2026 年 4 月以匿名身份登顶全球权威 AI 评测平台 Artificial Analysis Video Arena 文生视频、图生视频双榜,4 月 27 日正式开启灰度商用测试,通过阿里云百炼平台、HappyHorse 官网、千问 App 三大入口开放使用,是当前国内 AI 视频生成赛道的标杆级产品。HappyHorse官网:https://www.happyhorse.cn/
一、核心技术架构
HappyHorse 1.0 采用40 层统一自注意力 Transformer 单流架构,核心突破为原生音视频联合生成技术,区别于行业主流 “先生成无声视频、再单独配音对齐” 的两阶段方案,将文本、视频、音频 Token 纳入同一序列完成联合建模,中间 32 层实现参数共享,音画内容从同一次推理中同步生成,从底层解决了音画不同步、口型错位的行业痛点。
同时,模型搭载自研 DMD-2 蒸馏技术,完全消除 Classifier-Free Guidance 依赖,将去噪步骤压缩至 8 步;配合 FP8 量化优化,大幅降低算力门槛,单张 NVIDIA H100 显卡即可完成全质量 1080P 视频推理,算力消耗较行业主流模型降低约 60%。
二、模型核心参数
- 参数规模:150 亿(15B)参数量
- 上下文支持:支持复杂长提示词、多参考图输入,精准还原镜头语言、人物特征与场景细节
- 生成分辨率:最高支持 1080P 全高清输出,兼容 720P、480P 多档位规格
- 生成时长:单条视频支持 3-15 秒生成,可实现多镜头连贯叙事、运镜切换
- 推理速度:单张 H100 显卡生成 5 秒 1080P 带音频视频仅需约 38 秒,较行业主流模型快 2-3 倍
- 多语言支持:原生支持中文、英语、日语、韩语、德语、法语、粤语 7 种语言,口型同步词错误率为同类模型最低
- 开源状态:官方确认 HappyHorse 1.0 为闭源模型,无开源权重释放计划,仅通过云端 API 与官方平台提供服务
三、HappyHorse快速体验
在:阿里云百炼AI大模型平台 快速体验HappyHorse,如下图:
三、模型版本与迭代节点
目前官方正式对外发布的核心版本为HappyHorse 1.0,关键迭代与发布节点如下:
- 2026 年 4 月 7 日:以匿名模型身份上线 Artificial Analysis Video Arena 榜单,文生视频 Elo 评分 1384、图生视频 1413,双榜登顶,超越同期 Seedance 2.0、Google Veo 等头部模型
- 2026 年 4 月 10 日:阿里 ATH 创新事业部正式认领该模型,披露核心技术架构与研发团队信息
- 2026 年 4 月 20 日:官宣将于 4 月 27 日开放 API 测试,首批面向企业级客户开放邀测
- 2026 年 4 月 27 日:HappyHorse 1.0 正式开启全网灰度测试,同步上线官网、阿里云百炼平台、千问 App 三大使用入口,开放个人与企业用户注册使用
四、费用与定价体系
HappyHorse 采用按秒计费 + 会员订阅双模式,新用户注册即赠送免费体验额度,具体定价如下:
| 分辨率 | 官方刊例价 | Pro 包月会员限时折扣价 |
| 720P | 0.9 元 / 秒 | 0.44 元 / 秒 |
| 1080P | 1.6 元 / 秒 | 0.78 元 / 秒 |
订阅套餐权益
- 免费版:每日登录赠送免费积分,支持 2 路并行生成,带品牌水印,仅支持 720P 分辨率
- 标准版:支持 10 路并行生成,可批量生成、优先队列调度,去除水印,开放 1080P 分辨率
- 专业版(Pro):无上限并行生成,独享最高优先级队列,全分辨率开放,叠加限时折扣后享受最低 0.44 元 / 秒生成价
- 企业 API:阿里云百炼平台开放 API 调用,定价与官网刊例价一致,支持企业级定制化合作与按量计费
五、核心竞争优势
- 原生音画同步,底层技术突破
行业少有的单流架构音视频联合生成方案,彻底解决传统两阶段方案的音画错位、口型不同步问题,原生支持台词、环境音同步生成,适配短剧、口播、广告片等剧情类内容生产。 - 生成效率领先,批量生产友好
8 步极速推理 + 阿里云端算力支撑,简单场景 15 秒视频生成最快 1-2 分钟完成,复杂场景仅需 3-5 分钟,较同类模型速度提升 2-3 倍,高峰期无排队降速,适配创作者批量内容生产。 - 中文语境理解拉满,人物一致性突出
针对中文提示词、东方审美、中文意境做深度优化,对镜头语言、氛围感、人物特征的理解远超海外模型;多镜头切换、多场景叙事中,同一人物面部特征、服装风格保持高度稳定,大幅降低后期修片成本。 - 极致性价比,降低商用门槛
会员价最低 0.44 元 / 秒,仅为行业主流模型定价的 60% 左右,配合阿里云端算力的稳定性,兼顾成本与成片质量,对个人创作者、MCN、中小企业、电商商家等群体友好。 - 全场景能力覆盖,阿里生态无缝适配
支持文生视频、图生视频、多图参考生视频、视频二次编辑全流程能力;深度适配阿里云百炼平台、千问 App、阿里系 Agent 工具,企业用户可通过 API 快速集成至自有业务系统,适配电商营销、短剧创作、品牌广告、知识科普等全场景。