“洛犀” 端云协同AI平台,来了

简介: 在 “中国工程院院刊:信息领域青年学术前沿论坛上”,阿里巴巴达摩院、浙江大学上海高等研究院、上海人工智能实验室联合发布“洛犀”端云协同平台。

在 “中国工程院院刊:信息领域青年学术前沿论坛上”,阿里巴巴达摩院、浙江大学上海高等研究院、上海人工智能实验室联合发布“洛犀”端云协同平台。

该平台提供一站式的端云协同模型训练、部署、通信能力,致力于促进大小模型协同进化,构建充分利用大模型应用潜力的新一代人工智能体系。

因惊艳的性能表现和前所未有的任务迁移性,AI大模型在2021年迎来大爆发,但能耗问题限制其参数扩张及应用落地。

2022达摩院十大科技趋势指出,大模型参数竞赛正进入冷静期,大小模型将在云边端协同进化——大模型向边、端的小模型输出模型能力,小模型负责实际的推理与执行,同时小模型再向大模型反馈算法与执行成效,让大模型的能力持续强化。

在此背景下,阿里巴巴达摩院联合浙江大学上海高等研究院、上海人工智能实验室研制了“洛犀”平台。该名取自宇宙中大小星体间永恒的洛希吸引力,并含强大、坚韧之意,寓意大小模型珠联璧合。

image.png
洛犀平台沉淀了端云两侧最佳实践的算法组件和平台服务。其中,平台在端侧以python/js package的形式提供服务,包含表征、文本理解、图计算等能力;在端云链路上,平台提供实现端云协同关键的通信能力,包括方案分发、数据通信链路;端云协同的模型训练累积沉淀在云端,包括端模型训练等。

image.png

包含10万亿参数的达摩院大模型M6,是目前业界最大的多模态预训练模型。通过洛犀平台技术,联合研究团队成功将3.4亿参数版本的M6模型高精度压缩至百万参数的10MB大小,以1/30的体积还原了90%以上性能,并试点部署于搜索场景,成为业界首个落地的端上预训练模型。

此外,团队还借助洛犀完成了图神经网络、排序模型、强化学习等技术在端云协同范式下的部署。

“须弥藏芥子,芥子纳须弥。”浙江大学上海高等研究院常务副院长吴飞教授如此形容大小模型间的辩证关系。庞大的须弥山如何纳入极微小的种子中?

答案是取其精髓、化繁为简。大模型通过高精度压缩,化身为终端可用的小模型,小模型的实践累积起来,将不断提升云端大模型的认知推理能力,实现“集众智者无畏于圣人”。

达摩院智能计算实验室负责人周靖人介绍,团队将进一步探索端云协同框架下端模型和云模型的协同机理,并完善算法方案和业务实践。洛犀平台未来计划对开发者开放,让大小模型协同进化的时代加速到来。

上海人工智能实验室主任助理王延峰教授表示,实验室将携手产学研精英,共同构建具有国际影响力的人工智能生态。

备注:来源| 阿里云公众号

相关文章
|
1天前
|
存储 人工智能 自然语言处理
FoloUp:比HR更懂岗位需求!开源语音面试平台爆火:1份岗位需求生成100问,语音AI追问逻辑漏洞
FoloUp 是一个开源的 AI 语音面试平台,能够根据职位描述自动生成定制化的面试问题,并与候选人进行自然对话式的语音面试,帮助企业高效招聘。
29 9
FoloUp:比HR更懂岗位需求!开源语音面试平台爆火:1份岗位需求生成100问,语音AI追问逻辑漏洞
|
6天前
|
存储 人工智能 前端开发
平替cursor : 全平台AI程序员插件,免费无广
平替cursor : 全平台AI程序员插件,免费无广。
183 11
|
6天前
|
人工智能 安全 机器人
LangBot:无缝集成到QQ、微信等消息平台的AI聊天机器人平台
LangBot 是一个开源的多模态即时聊天机器人平台,支持多种即时通信平台和大语言模型,具备多模态交互、插件扩展和Web管理面板等功能。
328 14
LangBot:无缝集成到QQ、微信等消息平台的AI聊天机器人平台
|
6天前
|
存储 人工智能 NoSQL
Airweave:快速集成应用数据打造AI知识库的开源平台,支持多源整合和自动同步数据
Airweave 是一个开源工具,能够将应用程序的数据同步到图数据库和向量数据库中,实现智能代理检索。它支持无代码集成、多租户支持和自动同步等功能。
66 14
|
6天前
|
人工智能 Linux 开发工具
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
Kiln AI 是一款开源的 AI 开发工具,支持零代码微调多种语言模型,生成合成数据,团队协作开发,自动部署。帮助用户快速构建高质量的 AI 模型。
385 7
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
|
8天前
|
人工智能 开发框架 机器人
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
AstrBot 是一个开源的多平台聊天机器人及开发框架,支持多种大语言模型和消息平台,具备多轮对话、语音转文字等功能。
2160 13
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
|
14天前
|
人工智能 物联网 开发者
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
Oumi 是一个完全开源的 AI 平台,支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型,提供零样板代码开发体验。
203 43
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
|
27天前
|
存储 人工智能 Serverless
AI 短剧遇上函数计算,一键搭建内容创意平台
为了帮助更多内容创作者和企业快速实现 AI 短剧创作,函数计算 FC 联合百炼联合推出“AI 剧本生成与动画创作解决方案”,通过函数计算 FC 构建 Web 服务,结合百炼模型服务和 ComfyUI 生图平台,实现从故事剧本撰写、插图设计、声音合成和字幕添加到视频合成的一站式自动化流程。创作者只需通过简单操作,就能快速生成高质量的剧本,并一键转化为精美的动画。
|
1月前
|
SQL 人工智能 数据管理
跨云数据管理平台DMS:构建Data+AI的企业智能Data Mesh
跨云数据管理平台DMS助力企业构建智能Data Mesh,实现Data+AI的统一管理。DMS提供开放式元数据服务OneMeta、一站式智能开发平台和云原生AI数据平台,支持多模数据管理和高效的数据处理。结合PolarDB、AnalyticDB等核心引擎,DMS在多个垂直场景中展现出显著优势,如智能营销和向量搜索,提升业务效率和准确性。通过DataOps和MLOps的融合,DMS为企业提供了从数据到AI模型的全生命周期管理,推动数据驱动的业务创新。
|
1月前
|
机器学习/深度学习 人工智能 缓存
基于英特尔平台加速 AI 应用及 LLM 推理性能介绍|龙蜥大讲堂第115期
本文摘自龙蜥大讲堂英特尔 AI 软件工程师黄文欢的分享,主要包括以下三个方面的内容: 1. 第五代英特尔至强处理器 2. LLM 推理加速框架 xFast Transformer 及其优化策略 3. 性能数据及 Demo 展示

热门文章

最新文章