FlashLabs 正式发布 Chroma 1.0 - 全球首个开源、端到端、实时语音到语音 AI 模型 → 支持个性化语音克隆

简介: FlashLabs 发布全球首个开源、端到端、实时语音到语音 AI 模型 Chroma 1.0,支持低延迟(TTFT \x26lt; 150ms)、高保真语音克隆与强对话能力,旨在成为 OpenAI Realtime API 的开源替代方案。

今天,FlashLabs 正式发布 Chroma 1.0 ——全球首个开源的支持声音克隆、高保真、端到端、实时语音到语音(Speech-to-Speech)AI 模型,并逐步部署于 FlashAI语音智能体平台。


Chroma 是一个研究级、完全开源的实时语音模型,定位为 OpenAI Realtime API 的开放替代方案,面向全球开发者、研究者与企业用户。

🚨 Chroma 1.0 有什么不同?

与传统「ASR → LLM → TTS」多阶段管线不同,Chroma 原生支持语音到语音的端到端建模,在延迟、自然度与一致性上实现突破式提升。


核心亮点

  • 端到端首字节延迟(TTFT)< 150ms

  • 🎙️原生Speech-to-Speech架构(非拼接式流水线)
  • 🧬几秒参考音频即可完成高保真声音克隆
  • 📈SIM相似度=0.817
    • 相比人类基线(0.73)提升+10.96%
    • 在已测试的开源与闭源模型中表现领先
  • 🧠仅4B参数即具备强对话与推理能力
    • 基于Qwen2.5-Omni-3B、Llama 3、Mimi等架构优化
  • 🔓完全开源(代码+权重)

Chroma在发布当天即支持SGLang推理框架,用于高并发、低延迟实时语音场景:

  • 🧠Thinker TTFT再降≈15%
  • ⏱️端到端TTFT低至≈135ms
  • 🔊实时因子(RTF)≈0.47–0.51

🌍 面向未来的实时语音 AI 基础模型

Chroma 1.0 的发布,标志着实时语音 AI 正式进入“开源 + 端到端 + 低延迟”的新阶段
它不仅适用于 AI 呼叫中心、语音客服、销售外呼、虚拟人、实时翻译 等场景,也为研究者提供了一个可复现、可扩展的基础模型。

FlashLabs 相信:

语音将成为 AI 时代最重要的人机接口,而实时性是决定体验的关键。

Chroma 1.0 让开源社区首次拥有能够与顶级闭源产品相媲美的语音实时端到端、高保真生成能力。

🔗 了解更多


  • 演示视频(Voice Test):
    以下视频来源于
    FlashLabs


点击即可跳转模型链接~

https://modelscope.cn/models/FlashLabs/Chroma-4B

目录
相关文章
|
10天前
|
人工智能 JavaScript Linux
【Claude Code 全攻略】终端AI编程助手从入门到进阶(2026最新版)
Claude Code是Anthropic推出的终端原生AI编程助手,支持40+语言、200k超长上下文,无需切换IDE即可实现代码生成、调试、项目导航与自动化任务。本文详解其安装配置、四大核心功能及进阶技巧,助你全面提升开发效率,搭配GitHub Copilot使用更佳。
|
4天前
|
JSON API 数据格式
OpenCode入门使用教程
本教程介绍如何通过安装OpenCode并配置Canopy Wave API来使用开源模型。首先全局安装OpenCode,然后设置API密钥并创建配置文件,最后在控制台中连接模型并开始交互。
1832 6
|
11天前
|
存储 人工智能 自然语言处理
OpenSpec技术规范+实例应用
OpenSpec 是面向 AI 智能体的轻量级规范驱动开发框架,通过“提案-审查-实施-归档”工作流,解决 AI 编程中的需求偏移与不可预测性问题。它以机器可读的规范为“单一真相源”,将模糊提示转化为可落地的工程实践,助力开发者高效构建稳定、可审计的生产级系统,实现从“凭感觉聊天”到“按规范开发”的跃迁。
1872 18
|
10天前
|
人工智能 JavaScript 前端开发
【2026最新最全】一篇文章带你学会Cursor编程工具
本文介绍了Cursor的下载安装、账号注册、汉化设置、核心模式(Agent、Plan、Debug、Ask)及高阶功能,如@引用、@Doc文档库、@Browser自动化和Rules规则配置,助力开发者高效使用AI编程工具。
1336 7
|
11天前
|
消息中间件 人工智能 Kubernetes
阿里云云原生应用平台岗位急招,加入我们,打造 AI 最强基础设施
云原生应用平台作为中国最大云计算公司的基石,现全面转向 AI,打造 AI 时代最强基础设施。寻找热爱技术、具备工程极致追求的架构师、极客与算法专家,共同重构计算、定义未来。杭州、北京、深圳、上海热招中,让我们一起在云端,重构 AI 的未来。
|
13天前
|
IDE 开发工具 C语言
【2026最新】VS2026下载安装使用保姆级教程(附安装包+图文步骤)
Visual Studio 2026是微软推出的最新Windows专属IDE,启动更快、内存占用更低,支持C++、Python等开发。推荐免费的Community版,安装简便,适合初学者与个人开发者使用。
1342 13
|
9天前
|
人工智能 JSON 自然语言处理
【2026最新最全】一篇文章带你学会Qoder编辑器
Qoder是一款面向程序员的AI编程助手,集智能补全、对话式编程、项目级理解、任务模式与规则驱动于一体,支持模型分级选择与CLI命令行操作,可自动生成文档、优化提示词,提升开发效率。
815 10
【2026最新最全】一篇文章带你学会Qoder编辑器
|
14天前
|
人工智能 测试技术 开发者
AI Coding后端开发实战:解锁AI辅助编程新范式
本文系统阐述了AI时代开发者如何高效协作AI Coding工具,强调破除认知误区、构建个人上下文管理体系,并精准判断AI输出质量。通过实战流程与案例,助力开发者实现从编码到架构思维的跃迁,成为人机协同的“超级开发者”。
1098 96
|
8天前
|
云安全 安全
免费+限量+领云小宝周边!「阿里云2026云上安全健康体检」火热进行中!
诚邀您进行年度自检,发现潜在风险,守护云上业务连续稳健运行
1181 2

热门文章

最新文章