动动嘴就能编程!阿里云千问Qwen3.5-Omni发布:全模态全球最强,支持113种语言,免费体验

简介: 阿里云发布全模态大模型Qwen3.5-Omni官网:https://t.aliyun.com/U/JbblVp 测试全球第一,支持113种语言识别与36种语音合成,首创“音视频Vibe Coding”——对镜头口述需求即可生成APP/网页/游戏代码。免费开放体验,开发者可通过阿里云百炼调用API。

刚刚,阿里云千问家族迎来新成员——Qwen3.5-Omni全模态大模型正式亮相。它在215项任务中拿下全球第一,能听懂113种语言和方言,甚至对着镜头说需求就能自动生成APP、网页、游戏代码。目前普通用户可免费体验,开发者可通过阿里云百炼调用API,阿里云百炼平台:https://www.aliyun.com/product/bailian  

阿里云百炼AI大模型平台.png

一、全模态王者:215项测试拿下SOTA

Qwen3.5-Omni采用混合注意力MoE架构,在海量文本、图像以及超过1亿小时的音视频数据上进行了原生多模态预训练。它支持图片、视频、语音、文字的全模态输入与输出。

在音视频理解、跨模态推理、智能体等215项第三方性能测试中,Qwen3.5-Omni全部取得SOTA(性能最佳),被评价为“目前全球最强的全模态大模型之一”。

关键对比数据:

  • DailyOmni、QualcommInteractive等视听交互测试:得分大幅领先Google Gemini-3.1 Pro
  • WenetSpeech嘈杂环境语音识别:错误率远低于Gemini
  • Multi-Lingual (30种语言) 语音生成质量:显著优于Gemini-2.5-Pro-TTS


关于Qwen3.5-Omni的详细介绍,请移步到阿里云通义大模型平台查看:https://www.aliyun.com/product/tongyi  如下图:

千问大模型.png

二、听懂113种语言,实时交互像真人

Qwen3.5-Omni支持113种语言及方言的语音识别,以及36种语言及方言的语音生成。就连使用人数不足百万的毛利语海南话,也能精准识别。

实时交互体验大幅升级:

  • 能高情商理解用户对话意图,区分有效回应与随口附和
  • 可根据指令自由调节语音、语调
  • 基于ARIA技术,生成语音更自然、稳定
  • 面对实时提问(如“今天天气怎样”),能自主调用工具获取最新信息

三、音视频Vibe Coding:动动嘴就能编程

这是最令人惊喜的能力。与纯文本或图片驱动的Vibe Coding不同,千问实现了音视频编程

打开摄像头,对着草图口述需求——哪怕包含复杂的产品逻辑——模型就能直接生成带有复杂UI的产品原型界面、网页、甚至小游戏。

这一能力并非刻意设计,而是模型在原生多模态能力持续扩展中自然涌现的结果。从此,“动动嘴即可编程”成为现实。

四、超长音频+画面校对,专业生产力工具

Qwen3.5-Omni能对视频中的画面主体、人物关系、对话逻辑、情绪起伏进行极致拆解,自动完成视频章节切片与时间戳标注。

  • 支持超过10小时的音频输入
  • 繁琐的视频后期梳理工作缩短至秒级
  • 大幅降低内容管理成本,适用于视频创作、内容审核等场景

五、如何体验与调用

  • 普通用户:前往 Qwen Chat 免费体验
  • 开发者和企业:通过阿里云百炼平台调用Qwen3.5-Omni模型的三种API版本:
  • Plus:高性能版
  • Flash:轻量快速版
  • Light:超低成本版

总结:Qwen3.5-Omni不仅刷新了全模态大模型的天花板,更用“音视频编程”打开了人机协作的新想象空间。无论是个人开发者想尝鲜,还是企业需要落地音视频理解、自动编程、多语言交互,现在都可以零门槛上手。更多关于阿里云千问Qwen3.5-Omni的介绍、调用及使用,请移步到阿里云百炼官方平台查看:https://www.aliyun.com/product/bailian  

目录
相关文章
|
9天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
11155 102
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
9天前
|
人工智能 IDE API
2026年国内 Codex 安装教程和使用教程:GPT-5.4 完整指南
Codex已进化为AI编程智能体,不仅能补全代码,更能理解项目、自动重构、执行任务。本文详解国内安装、GPT-5.4接入、cc-switch中转配置及实战开发流程,助你从零掌握“描述需求→AI实现”的新一代工程范式。(239字)
5644 136
|
7天前
|
人工智能 并行计算 Linux
本地私有化AI助手搭建指南:Ollama+Qwen3.5-27B+OpenClaw阿里云/本地部署流程
本文提供的全流程方案,从Ollama安装、Qwen3.5-27B部署,到OpenClaw全平台安装与模型对接,再到RTX 4090专属优化,覆盖了搭建过程的每一个关键环节,所有代码命令可直接复制执行。使用过程中,建议优先使用本地模型保障隐私,按需切换云端模型补充功能,同时注重显卡温度与显存占用监控,确保系统稳定运行。
1946 5
|
6天前
|
人工智能 自然语言处理 供应链
【最新】阿里云ClawHub Skill扫描:3万个AI Agent技能中的安全度量
阿里云扫描3万+AI Skill,发现AI检测引擎可识别80%+威胁,远高于传统引擎。
1398 3
|
6天前
|
人工智能 Linux API
离线AI部署终极手册:OpenClaw+Ollama本地模型匹配、全环境搭建与问题一站式解决
在本地私有化部署AI智能体,已成为隐私敏感、低成本、稳定运行的主流方案。OpenClaw作为轻量化可扩展Agent框架,搭配Ollama本地大模型运行工具,可实现完全离线、无API依赖、无流量费用的个人数字助理。但很多用户在实践中面临三大难题:**不知道自己硬件能跑什么模型、显存/内存频繁爆仓、Skills功能因模型不支持工具调用而失效**。
3172 7