GLM-Realtime：智谱推出多模态交互AI模型，融入清唱功能，支持视频和语音交互

2025-01-21 1082

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： GLM-Realtime 是智谱推出的端到端多模态模型，具备低延迟的视频理解与语音交互能力，支持清唱功能、2分钟内容记忆及灵活调用外部工具，适用于多种智能场景。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日分享大模型与 AI 领域的最新开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

正文（附运行示例）

GLM-Realtime

GLM-Realtime 是智谱推出的全新端到端多模态模型，专注于低延迟的视频理解与语音交互能力。该模型不仅支持长达2分钟的内容记忆，还创新性地融入了清唱功能，使大模型在对话中能够展现歌唱才能，为用户带来更丰富的交互体验。

此外，GLM-Realtime 还支持 Function Call 功能，能够灵活调用外部知识和工具，进一步拓展其应用范围。目前，GLM-Realtime API 已在智谱开放平台上线，开发者可以免费调用，为 AI 硬件的发展提供智能基础。

🥦 微信公众号｜搜一搜：蚝油菜花 🥦