AI大模型评估,阿里云获6项满分

简介: AI大模型评估,阿里云获6项满分


近日,国际数据公司IDC 最新发布《AI大模型技术能力评估报告,2023》,从算法、生态、服务能力等多个维度评估中国大模型的整体实力。


阿里云在11项指标中获得通用能力、服务能力、创新能力、生态合作等6项满分,是唯一一家“服务能力”满分厂商。


图片来源:IDC《AI大模型技术能力评估报告,2023》


IDC在报告中提出了AI大模型技术评估框架,评估维度涵盖算法模型、基础能力、创新及定制化能力、平台能力、安全可解释、行业应用,以及配套服务和大模型生态等指标,意在全面衡量中国AI大模型市场进程。


阿里云等14家大模型厂商参与了本次评估,阿里云在11项指标中获得6项满分,它们分别是通用能力、服务能力、创新能力、平台能力、生态合作、电商行业应用。


“通用能力”指标反映的是大模型的整体技能,包括语音识别、语音合成等自然语言处理;图片生成、图片搜索等计算机视觉;机器学习/深度神经网络等底层技术能力的差异化优势;意图识别、泛化能力、知识库构建能力等等。


目前,阿里云的通义大模型家族现已具备处理或生成文本、语音和图片等多种模态的能力。过去3个月,阿里云先后推出了基础模型“通义千问”、音视频大模型产品“通义听悟”、 AI绘画创作大模型“通义万相”,通义大模型家族仍在不断迭代和进化中。


2023年4月,阿里云峰会

阿里巴巴集团董事会主席兼首席执行官、阿里云智能集团董事长兼首席执行官张勇在云峰会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。



2023年6月,阿里云峰会·粤港澳大湾区

阿里云在本次会上宣布了聚焦音视频的AI新品——“通义听悟”上线,并开放公测。这也是国内首个开放公测的大模型应用产品。



2023年7月,2023世界人工智能大会

阿里云宣布通义系列AI绘画创作大模型通义万相开启定向邀测,该模型可辅助人类进行图片创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。



作为基础模型提供方,大模型厂商的平台能力、服务能力和生态合作水平对行业发展至为重要。阿里云在这三个指标上都获得了满分,且是唯一获得“服务能力”满分的厂商。


IDC报告指出:“由于训练大模型的成本极高,普通开发者和中小企业无从下手,提前布局一套完整的生态系统就变得尤为重要,让大模型从已有走向可用,进而赋能千行百业。”


阿里云是模型服务和生态建设方面的先行者。2022年阿里云在业界首提MaaS(Model as a Service,模型即服务)理念,并据此搭建以AI模型为核心的云计算技术和服务架构,为新一轮AI浪潮下的大模型生态建设提供了理论依据和最佳实践,迅速成为行业共识。


阿里云把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供包括模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务,并在资金和商业化探索方面提供充分支持。


作为阿里云践行MaaS理念的重要探索之一,2022年推出的AI模型社区魔搭(Modelscope)已经成为国内规模最大、生态最活跃的AI开发者社区,集聚180多万AI开发者和900多个优质AI模型,模型累计下载量超过3600万。


魔搭社区的模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等(排名不分先后),他们贡献了30多个10亿以上参数规模大模型。“找大模型上魔搭”,阿里云将努力把魔搭社区培育成中国最大的“大模型自由市场”。



/ END /

目录
相关文章
|
8天前
|
人工智能 Java Serverless
阿里云函数计算助力AI大模型快速部署
随着人工智能技术的快速发展,AI大模型已经成为企业数字化转型的重要工具。然而,对于许多业务人员、开发者以及企业来说,探索和利用AI大模型仍然面临诸多挑战。业务人员可能缺乏编程技能,难以快速上手AI模型;开发者可能受限于GPU资源,无法高效构建和部署AI应用;企业则希望简化技术门槛,以更低的成本和更高的效率利用AI大模型。
48 12
|
7天前
|
人工智能 安全 数据安全/隐私保护
文档智能 & RAG让AI大模型更懂业务测评
文档智能 & RAG让AI大模型更懂业务
117 73
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
智谱AI推出的GLM-4V-Flash是一款专注于图像理解的免费开放大模型,提供API接口支持用户上传图片URL或Base64编码图片获取详细的图像描述。该模型通过深度学习和卷积神经网络技术,简化了图像分析流程,提高了开发效率,适用于内容审核、辅助视障人士、社交媒体、教育和电子商务等多个应用场景。
63 14
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
|
6天前
|
人工智能 安全 测试技术
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。
45 9
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
|
8天前
|
机器学习/深度学习 人工智能
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是一个创新的AI文本到图像生成框架,通过增强单步扩散模型的指导,显著提升模型性能和控制力。该框架包括PG-SB和NASA两种技术,分别用于增强训练稳定性和整合负面提示。SNOOPI在多个评估指标上超越基线模型,尤其在HPSv2得分达到31.08,成为单步扩散模型的新标杆。
48 10
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
|
8天前
|
人工智能 搜索推荐 开发者
Aurora:xAI 为 Grok AI 推出新的图像生成模型,xAI Premium 用户可无限制访问
Aurora是xAI为Grok AI助手推出的新图像生成模型,专注于生成高逼真度的图像,特别是在人物和风景图像方面。该模型支持文本到图像的生成,并能处理包括公共人物和版权形象在内的多种图像生成请求。Aurora的可用性因用户等级而异,免费用户每天能生成三张图像,而Premium用户则可享受无限制访问。
46 11
Aurora:xAI 为 Grok AI 推出新的图像生成模型,xAI Premium 用户可无限制访问
|
6天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
12月05日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·电子科技大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
|
6天前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
2天前
|
人工智能 自然语言处理 物联网
AI Safeguard联合 CMU,斯坦福提出端侧多模态小模型
随着人工智能的快速发展,多模态大模型(MLLMs)在计算机视觉、自然语言处理和多模态任务中扮演着重要角色。
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
转载:【AI系统】AI的领域、场景与行业应用
本文概述了AI的历史、现状及发展趋势,探讨了AI在计算机视觉、自然语言处理、语音识别等领域的应用,以及在金融、医疗、教育、互联网等行业中的实践案例。随着技术进步,AI模型正从单一走向多样化,从小规模到大规模分布式训练,企业级AI系统设计面临更多挑战,同时也带来了新的研究与工程实践机遇。文中强调了AI基础设施的重要性,并鼓励读者深入了解AI系统的设计原则与研究方法,共同推动AI技术的发展。
转载:【AI系统】AI的领域、场景与行业应用