国内首家! 阿里云人工智能平台 PAI 通过 ITU 国际标准测评

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 阿里云人工智能平台 PAI 顺利通过中国信通院组织的 ITU-T AICP-GA国际标准和《智算工程平台能力要求》国内标准一致性测评,成为国内首家通过该标准的企业。阿里云人工智能平台 PAI 参与完成了智算安全、AI 能力中心、数据工程、模型开发训练、模型推理部署等全部八个能力域,共计220余个用例的测试,并100%通过测试要求,获得了 ITU 国际标准和国内可信云标准评估通过双证书。

近日,阿里云人工智能平台 PAI 顺利通过中国信通院组织的 ITU-T AICP-GA(Technical Specification for Artificial Intelligence Cloud Platform:General Architecture)国际标准和《智算工程平台能力要求》国内标准一致性测评,成为国内首家通过该标准的企业。阿里云人工智能平台 PAI 参与完成了智算安全、AI 能力中心、数据工程、模型开发训练、模型推理部署等全部八个能力域,共计220余个用例的测试,并100%通过测试要求,获得了 ITU 国际标准和国内可信云标准评估通过双证书。
image.png

ITU-T F.AICP 系列标准作为国内唯一在 ITU-T SG16 立项的人工智能云平台技术规范,能够客观衡量企业人工智能云平台产品的能力,指导企业构建人工智能云平台服务规范,为用户选择人工智能云产品提供参考。同时,《智算工程平台能力要求》作为人工智能云平台领域上与国际标准相同步、并相互兼容与认可的标准规范,是企业人工智能云平台产品在国内应用的重要指导。

阿里云人工智能平台 PAI 产品介绍

阿里云人工智能平台 PAI(Platform for AI)是面向企业客户及开发者的一站式 AI 平台,提供模型开发平台、模型训练服务、以及模型推理服务,包括 PAI-iTag 智能标注、PAI-FeatureStore 特征存储、PAI-DSW 交互式建模、PAI-Designer 可视化建模、PAI-DLC 分布式训练、以及 PAI-EAS 在线部署、PAI-Blade 推理加速等功能模块,涵盖 AI 开发的完整流程。PAI 还提供场景化最佳实践 QuickStart 和行业领域 AIGC 工具 ArtLab。
image.png

1. 模型开发平台:PAI-DSW 交互式建模、PAI-Deigner 可视化建模

PAI-DSW(Data Science Workshop)是为算法开发者量身打造的交互式云端开发 IDE,支持 Copilot 辅助编程,提供丰富的异构计算资源,预置多种开源框架的镜像,支持实例的生命周期管理。提供海量前沿案例,以 Notebook 的形式提供热门场景的最佳实践,如 Stable Diffusion、Llama2、通义千问系列大模型等。
PAI-Designer 是 PAI 产品基于云原生架构和工作流引擎开发的可视化建模工具,提供端到端的机器学习全链路开发环境,内置丰富且成熟的机器学习算法,覆盖商品推荐、金融风控及广告预测等场景,满足不同方向的业务需求。
image.png

2. 模型训练服务:PAI-DLC 大规模分布式任务

分布式训练 PAI-DLC(Deep Learning Containers)是基于云原生的 AI 训练平台,为开发者和企业提供灵活、稳定、易用和高性能的机器学习训练环境。

  • 极致的易用性:
    PAI 提供 Serverless 分布式任务,无需搭建各种集群,可以直接提交 Megatron, Deepspeed, Pytorch, Tensorflow, Slurm, Ray, MPI 等十多种训练框架的任务。支持竞价任务模式(Spot),具备分布式任务异构算力、多级 Quota 管理、任务形态混合运行、任务无感切换等能力。
  • 极致的稳定:
    自研的容错引擎 AIMaster、高性能 Checkpoint 框架 EasyCKPT、健康检测 SanityCheck 以及节点自愈功能,有效解决多种稳定性问题。具备快速探查、准确感应与快速反馈的能力,有效降低算力损失,提升训练稳定性。
  • 极致的性能:
    自研 AI 训练加速框架,实现统一数据并行、流水并行、算子拆分以及嵌套的并行加速策略。通过并行策略自动探索和多维度显存优化,结合高速网络的拓扑感知调度,以及通信线程池、梯度分组融合、混合精度通信、梯度压缩等分布式通信库的优化,提升分布式训练效率。
    图片image.png

3. 模型推理服务:PAI-EAS 模型部署与在线服务、PAI-Blade 推理加速

模型在线服务 PAI-EAS(Elastic Algorithm Service)是 PAI 产品为实现一站式模型开发部署应用,针对在线推理场景提供的模型在线服务,在全球范围内16个 Region 提供服务,集群规模超过10万卡量级。

  • 一站式快速部署:
    支持实时在线服务、近实时异步推理、离线批量推理等多种任务类型,支持一键压测、灰度发布、监控报警等模型部署能力,支持场景化和模版化部署(例如 LLM,ComfyUI 视频生成,RAG 对话系统等)。
  • 全方位的性价比:
    通过弹性扩缩容、定时扩缩容、弹性资源池等实现高效的集群资源调度,达到整体降本增效。通过抢占型实例资源、GPU 资源共享、Serverless 模型服务等方式大幅降低部署成本最高达90%。
  • 深度的优化加速:
    通过推理优化引擎 PAI-BladeLLM,综合 BlaDNN 高性能算子、量化、 PD 分离的分布式推理、Prompt cache 缓存优化等技术,降低首包时延 (TTFT) 60%+、降低 token 输出时延 (TPOT) 70%+、提升推理吞吐80%+。
    image.png

4. 场景化最佳实践:PAI-QuickStart、PAI-ArtLab

PAI-QuickStart 整合了 Model Gallery 模型广场、Notebook Gallery 案例资源等,集成丰富的预训练模型(LLM、CV、NLP、语音),提供一站式零代码、低门槛的模型一键微调、部署、评测能力,快速帮助用户上手 AI 开发。
PAI-ArtLab 提供了行业化的 AIGC 解决方案,为没有 AI 技术背景的行业开发者提供了开箱即用的低代码化的 AI 开发工具链,降低了 AI 开发的门槛。
image.png

5. AI 与大数据一体化:智能标注 PAI-iTag、多种场景数据处理、AI 血缘全链路追溯等

PAI-iTAG 是智能化数据标注平台,支持图像、文本、视频、音频等多种数据类型的标注以及多模态的混合标注,提供了丰富的标注内容组件,支持 AI 赋能的自动标注以及丰富的预置模版。PAI 构建了 AI 资产全链路数据服务体系,具备全生命周期数据管理、多模态数据清洗、多模态数据分析、智能化数据标注和增强等能力,并提供全局的模型和数据血缘追溯能力。
image.png

6. 企业级能力:工作空间与权限管理、资源与资产管理、安全与可信 AI 等

PAI 平台提供全方位的企业级能力,能高效解决企业内部 AI 计算资源、开发人员、权限、AI 资产之间的关系,创建生产级的高质量模型及应用。PAI 平台支持可信 AI 模块,具备毒性数据清洗、算法公平性/错误性识别、机密计算容器、不当推理内容拦截等功能,保障模型和数据安全。
image.png

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
1月前
|
人工智能
2025年人工智能与可持续发展国际学术会议 2025 International Conference on Artificial Intelligence and Sustainable Development (ICAISD 2025)
2025年人工智能与可持续发展国际学术会议 2025 International Conference on Artificial Intelligence and Sustainable Development (ICAISD 2025)
108 7
|
2月前
|
机器学习/深度学习 测试技术
阿里云入选Gartner数据科学和机器学习平台挑战者象限
Gartner® 正式发布了《数据科学与机器学习平台魔力象限》报告(Magic Quadrant™ for Data Science and Machine Learning Platforms),阿里云成为唯一一家入选该报告的中国厂商,被评为“挑战者”(Challengers)。
|
9天前
|
开发者 Python
阿里云PAI DSW快速部署服务
在使用阿里云DSW实例进行开发的时候,可能需要快速部署服务测试应用效果。DSW实例目前已经支持通过自定义服务访问配置功能,对外提供服务访问能力,您在应用开发过程中无需分享整个DSW实例,即可将服务分享给协作开发者进行测试和验证。
55 23
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
【NeurIPS'24】阿里云 PAI 团队论文被收录为 Spotlight,并完成主题演讲分享
12月10日,NeurIPS 2024在温哥华开幕,阿里云PAI团队论文《PertEval: Unveiling Real Knowledge Capacity of LLMs with Knowledge-Invariant Perturbations》入选Spotlight,PAI团队还进行了“可信AI的技术解读与最佳实践”主题演讲,展示AI工程化平台产品能力。
|
1月前
|
人工智能 计算机视觉
第二届图像处理与人工智能国际学术会议(ICIPAI2025) 2025 2nd International Conference on Image Processing and Artificial Intelligence(ICIPAI2025)
第二届图像处理与人工智能国际学术会议(ICIPAI2025) 2025 2nd International Conference on Image Processing and Artificial Intelligence(ICIPAI2025)
32 1
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【EMNLP2024】阿里云人工智能平台 PAI 多篇论文入选 EMNLP2024
阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。
|
1月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
240 0
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在医疗诊断中的应用与前景####
本文深入探讨了人工智能(AI)技术在医疗诊断领域的应用现状、面临的挑战及未来发展趋势。通过分析AI如何辅助医生进行疾病诊断,提高诊断效率和准确性,以及其在个性化医疗中的潜力,文章揭示了AI技术对医疗行业变革的推动作用。同时,也指出了数据隐私、算法偏见等伦理问题,并展望了AI与人类医生协同工作的前景。 ####
48 0
|
25天前
|
机器学习/深度学习 人工智能 搜索推荐
探索人工智能在现代医疗中的革新应用
本文深入探讨了人工智能(AI)技术在医疗领域的最新进展,重点分析了AI如何通过提高诊断准确性、个性化治疗方案的制定以及优化患者管理流程来革新现代医疗。文章还讨论了AI技术面临的挑战和未来发展趋势,为读者提供了一个全面了解AI在医疗领域应用的视角。
59 11
|
16天前
|
人工智能 缓存 异构计算
云原生AI加速生成式人工智能应用的部署构建
本文探讨了云原生技术背景下,尤其是Kubernetes和容器技术的发展,对模型推理服务带来的挑战与优化策略。文中详细介绍了Knative的弹性扩展机制,包括HPA和CronHPA,以及针对传统弹性扩展“滞后”问题提出的AHPA(高级弹性预测)。此外,文章重点介绍了Fluid项目,它通过分布式缓存优化了模型加载的I/O操作,显著缩短了推理服务的冷启动时间,特别是在处理大规模并发请求时表现出色。通过实际案例,展示了Fluid在vLLM和Qwen模型推理中的应用效果,证明了其在提高模型推理效率和响应速度方面的优势。
云原生AI加速生成式人工智能应用的部署构建

相关产品

  • 人工智能平台 PAI