阿里云将把促进中国大模型生态的繁荣作为首要目标

简介: 阿里云将把促进中国大模型生态的繁荣作为首要目标


今天,在上海世界人工智能大会上,阿里云CTO周靖人在演讲中表示:


阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。


阿里云魔搭社区现已聚集180万AI开发者和由20多家顶尖人工智能机构贡献的900多个优质AI模型,找大模型上魔搭,我们将努力把魔搭社区培育成中国最大的‘大模型自由市场’。



阿里云是业内最早布局大模型的科技公司之一,也是全球为数不多拥有超万亿参数大模型研发经验的机构,阿里云自研的通义系列大模型已发展成涵盖多个模型和产品的家族。


2022年,阿里云在国内首倡MaaS(Model as a Service,模型即服务)理念,提出以AI模型为核心的开发范式,并搭建了一套以AI模型为核心的云计算技术和服务架构,积累了丰富的大模型研发经验、工具和平台,这套能力将全部向大模型初创企业和开发者开放,提供包括模型训练、推理、部署、精调、测评、产品化落地等的全方位服务。



在基础设施层:

阿里云拥有国内最强的智能算力储备,阿里云的智算集群可支持最大十万卡GPU规模,承载多个万亿参数大模型同时在线训练,为大规模AI集群提供无拥塞通讯的自研RDMA网络架构和低成本高可靠的高性能存储CPFS。


在AI平台层:

以机器学习平台PAI为核心的PaaS服务可支持万卡的单任务分布式训练规模,覆盖全链路AI开发工具与大数据服务,AI训练效率提升可达10倍,推理效率提升可达6倍。

 

阿里云的灵积模型服务平台,将面向所有业界模型开放。平台建设了一系列自动化的模型上云统一工具链路,支持模型的自主接入,所有接入灵积平台的模型都能自动获取平台的强大服务能力,包括基于阿里云强大算力的跨区域自适应弹性能力,并提供基于云原生的公共部署以及用户自定义独占部署等多种形式,来满足不同模型的需求。


灵积平台还积累了模型自适应推理优化和高效微调训练的能力,并提供了基于插件进行模型能力拓展的系统框架。通过灵积,丰富多样化的模型不仅能通过推理API被集成,也能通过训练微调API实现模型定制化。对于AI开发者而言,这些不同模型的能力都能通过统一的SDK方便地获取并集成到自己的AI应用中去。


当前灵积平台上托管了包括通义千问、ChatGLM-v2、百川、姜子牙、Dolly等在内的业界领先大语言模型。


在开发者生态层:

阿里发起的AI模型社区魔搭集聚了180多万AI开发者和900多个优质AI模型。


模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等(排名不分先后),他们贡献了30多个10亿以上参数规模大模型。


在魔搭这个自由市场,所有模型生产者都可上传模型,验证模型的技术能力,探索模型的应用场景和商业化模式。魔搭社区打通了与灵积平台的部署链路,支持社区的模型通过灵积来实现服务化。


为进一步降低大模型使用门槛,阿里云在大会现场推出了一款智能工具魔搭GPT(ModelScopeGPT),它能接收用户指令,通过“中枢模型”一键调用魔搭社区其他的AI模型,大小模型协同完成复杂任务。这是国内首款大模型调用工具。

 

魔搭GPT现已能够调用魔搭社区十多个核心AI模型的API,未来随着更多模型API的加入,魔搭GPT的能力也将不断增强。构建这一模型调用工具的数据集和训练方案将会对外开放,供开发者自行使用,开发者可以根据需要对不同的大模型和小模型进行组合。



阿里云能够满足大模型企业在不同场景的数据安全要求。阿里云是亚太区最早布局可信计算和机密计算的云服务厂商,在业内首个推出基于SGX2.0和TPM的虚拟化实例。


基于TPM、VTPM、虚拟化Enclave等技术,阿里云构建了基于神龙安全芯片的全隔离、高可信的计算环境,并通过硬件层、虚拟化层、应用层三种形态的机密计算能力,确保用户数据的机密性、可用性、完整性。


作为全球第三、亚太第一的云服务厂商,阿里云服务了全球超过400万客户,多年深耕产业智能,深悉工业、农业、医疗、办公、能源、零售、金融风控、传媒娱乐等行业的需求与痛点。


周靖人表示:“阿里云愿与合作伙伴共享大模型的市场机遇,与大模型企业和开发者共同探索可持续的商业化路径。”



/ END /

目录
相关文章
|
30天前
|
关系型数据库 分布式数据库 数据库
成都晨云信息技术完成阿里云PolarDB数据库产品生态集成认证
近日,成都晨云信息技术有限责任公司(以下简称晨云信息)与阿里云PolarDB PostgreSQL版数据库产品展开产品集成认证。测试结果表明,晨云信息旗下晨云-站群管理系统(V1.0)与阿里云以下产品:开源云原生数据库PolarDB PostgreSQL版(V11),完全满足产品兼容认证要求,兼容性良好,系统运行稳定。
|
1月前
|
自然语言处理
阿里云百炼大模型服务--企业知识检索问答指南
阿里云百炼提供的企业知识检索问答应用可以帮助大家实现让大模型瞬间“开挂”的技能。结合上传的知识数据,大模型识别解析学习文档内容,最终给出生成式回复。我们在通义千问-Turbo/Max大模型基础上,将文件上传、读取、切片、向量化等过程都开发好预置在应用中,实现开箱即用,更能满足您的日常需求。
|
10天前
|
监控 Serverless API
阿里云函数计算的工作原理与事件驱动模型密切相关
【4月更文挑战第17天】阿里云函数计算的工作原理与事件驱动模型密切相关
64 4
|
18天前
|
机器学习/深度学习 编解码 人工智能
阿里云百炼的模型怎么选择并体验
本模块为您提供大模型服务平台百炼中支持的模型类型,便于您快速根据自己的需求选择所需模型!
|
20天前
|
人工智能 自然语言处理 测试技术
“送云资源、用大模型” 阿里云启动云工开物“高校训练营”计划
“送云资源、用大模型” 阿里云启动云工开物“高校训练营”计划
31 1
|
20天前
|
云安全 人工智能 定位技术
交通运输部公路科学研究院携手阿里云共建交通行业大模型
交通运输部公路科学研究院携手阿里云共建交通行业大模型
22 0
|
25天前
|
机器学习/深度学习 分布式计算 数据挖掘
阿里云 MaxCompute MaxFrame 开启免费邀测,统一 Python 开发生态
阿里云 MaxCompute MaxFrame 正式开启邀测,统一 Python 开发生态,打破大数据及 AI 开发使用边界。
307 1
|
1月前
|
人工智能 数据可视化 API
阿里云百炼大模型服务--流程编排接入快速上手指南
流程编排是一种面向开发者的可视化开发工具,支持LLM、API、脚本等类型节点,旨在简化接入大型语言模型(LLM)流程,同时提供应用流程的全生命周期管理,包括流程的编排、试验、部署等,为开发者提供自定义AI应用开发一站式服务。
阿里云百炼大模型服务--模型训练指南
模型训练是通过Fine-tuning训练模式提高模型效果的功能模块,作为重要的大模型效果优化方式,用户可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型效果。
|
1月前
|
数据采集 SQL 自然语言处理
阿里云OpenSearch RAG混合检索Embedding模型荣获C-MTEB榜单第一
阿里云OpenSearch引擎通过Dense和Sparse混合检索技术,在中文Embedding模型C-MTEB榜单上拿到第一名,超越Baichuan和众多开源模型,尤其在Retrieval任务上大幅提升。
432 3

热门文章

最新文章