国际市场研究机构Omdia近日发布报告《Omdia Universe: Chinese Commercial Foundation Model, 2024》。阿里云入选领导者厂商,并在战略执行和能力两个维度均位居业界第一的位置。报告是Omdia首次面向中国商业基础模型服务商的研究成果,从模型的通用能力、专业领域能力,以及厂商的执行能力、解决方案丰富度、战略与创新、市场影响力,综合评价12家中国模型服务商的竞争力,帮助客户在引入模型服务时的选型。
Omdia认为通义千问开源系列模型在诸多主流基准测试中处于顶级或接近顶级的水平,且是全球少数能够处理东亚、东南亚、中东语言的多语言开源模型之一。除了先进的基础模型之外,模型即服务(MaaS)是阿里云在GenAI领域竞争的另一个关键部分。
阿里云作为业内最早布局大模型技术的科技公司之一,于2023年4月发布首个大语言模型通义千问,如今通义大模型家族已全面涵盖语言、图像、视频、音频等全模态,性能均跻身世界第一梯队,同时通义模型持续开源,已成为最受企业和开发者欢迎的国产大模型。
大语言模型方面,通义旗舰型Qwen-Max全方位升级,相比2023年4月的最初的通义大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类偏好的对齐水平有了质的飞跃,提升了700%以上,综合性能接近GPT-4o。
视觉模型方面,通义万相全面升级,并发布全新视频生成模型,可生成影视级高清视频。首批上线文生视频、图生视频功能,在文生视频中,用户输入任意文字提示词,即可生成一段高清视频,支持中英文多语言输入,并可以通过灵感扩写功能智能丰富视频内容表现力,支持16:9、9:16等多种比例生成;在图生视频功能中,支持用户将任意图片转化为动态视频,按照上传的图像比例或预设比例进行生成,同时可以通过提示词来控制视频运动。
开源生态方面,通义开源模型和衍生模型总数已超过7.4万个,超越Llama成为世界第一的模型群。