人工智能平台 PAI

首页 标签 人工智能平台 PAI
基于Megatron-Core的稀疏大模型训练工具:阿里云MoE大模型最佳实践
随着大模型技术的不断发展,模型结构和参数量级快速演化。大模型技术的应用层出不穷。大模型展现惊人效果,但训练和推理成本高,一直是巨大挑战。模型稀疏化能降低计算和存储消耗。近期以Mixtral为代表的MoE(多专家混合)大模型证明了稀疏MoE技术能大幅降低计算量、提升推理速度,模型效果甚至超过同规模稠密模型。阿里云PAI和NVIDIA团队深入合作,基于Megatron-Core MoE框架,解决了MoE大模型训练落地时会遇到的可拓展性、易用性、功能性以及收敛精度等核心问题,在下游任务上取得了很好的模型效果。
机器人训练纯仿真路线实现“零成本学习”,0真机数据,98%成功率!
2026年4月,某企业发布纯仿真训练具身模型,零真机数据实现近100% Zero-shot成功率,首次抓取率达98%。依托高保真仿真器学习物理规律,突破数据采集瓶颈,推动具身智能迈向“模型中心、软件定义、硬件重构”新范式。(239字)
2025数字员工技术选型白皮书:阿里云/亚马逊等5款产品云原生能力实测
本文深度评测阿里云、亚马逊、科大讯飞、玄晶引擎、安恒五款数字员工,围绕架构兼容性、开发友好度、性能稳定性三大维度,结合实测数据与企业案例,为开发者提供选型指南与避坑建议。
| |
来自: 物联网
基于TensorFlow Lite Micro在物联网设备上玩转TinyML之离线语音唤醒
本文介绍如何基于HaaS EDU K1进行TFLite-Micro离线语音模型的部署。通过本文将学习到离线语音识别全链路开发流程。从语音数据集采集到模型训练,再到模型部署的TinyML(微型机器学习)整个生命周期。
Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
阿里云的人工智能平台 PAI,作为一站式、 AI Native 的大模型与 AIGC 工程平台,为开发者和企业客户提供了 Qwen2.5-Coder 系列模型的全链路最佳实践。本文以Qwen2.5-Coder-32B为例,详细介绍在 PAI-QuickStart 完成 Qwen2.5-Coder 的训练、评测和快速部署。
免费试用