什么是基于异构计算的AI架构|学习笔记

简介: 快速学习什么是基于异构计算的AI架构

开发者学堂课程【如何利用飞天AI解决方案帮助升级异构计算的AI架构什么是基于异构计算的AI架构】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/648/detail/10746


什么是基于异构计算的 AI 架构


内容介绍:

一、人工智能三要素

二、异构计算满足人工智能算力需求

三、异构计算促进人工智能的发展简史

四、阿里云异构计算为 AI 提供全面算力

五、基于阿里云异构计算的AI应用架构


一、人工智能三要素

人工智能分为三个要素,算法、数据和计算力。如果把人工智能比作一艘冉冉飞起的火箭的话,算法就是它的控制台,能够控制它的方向;数据就是它的燃料,充分的数据可以燃烧;计算力就是它的加速引擎。今天重点分享的是计算力,依托计算,飞天AI的加速如何加速人工智能的引擎。

image.png


二、异构计算满足人工智能算力需求

深度学习对计算力的需求呈指数级增长;

异构计算性能增长超越了摩尔定律,满足AI深度学习的发展对算力的需求。

image.png

人工智能发展到今天,模型越来越复杂,计算的需求也越来越高,传统的 CPU 无法满足人工智能越来越高的计算的需求,因韦达这种 GPU 为代表的异构计算的性能远远超出了 CPU 的发展能力,异构计算能够满足人工智能的发展对算力的需求。

由图可知,因韦达的 GPU 算力性能的增长速度是远远超过传统的普通 CPU 的增长速度的,所以异构计算会把人工智能推向一个新的高度。


三、异构计算促进人工智能的发展简史

1980年,神经网络算法提出;但是近几十年都没有特别大的突破;在2011年,谷歌用12片 GPU 代替了2000片 CPU,通过深度神经网络算法让机器通过看视频学会了识别猫;在2012年,Alex 和 Hinton 用 GPU 加速的深度神经网络在 ImageNet 图像识别比赛上击败传统算法获得冠军;在2015年,Google 和微软用 GPU 加速的深度神经网络,在 ImageNet 比赛中击败了多项工人辨识度,也就是说,人工智能在这个时候在某些领域已经超越了人类;在2016年,谷歌旗下 Deep Mind 团队研发的机器人AlphaGo 以4比1战胜世界围棋冠军李世石,这是人工智能发展中的一个重要里程碑,训练用了50片 GPU,走棋网络用了174片GPU,以 GPU 为代表的异构计算以火箭引擎的方式推动人工智能火箭的发展。


四、阿里云异构计算为 AI 提供全面算力

image.png

有三种不同 GPU 的实例,轻量级 GPU 实例,把 P4和T4的卡做分片,最小能分到1/8的P4和1/8的T4的卡,这种实例比较适合机器学习以及对算力要求不高的深度学习推理;常规虚拟化 GPU 实例,是把整块 GPU 卡作为加速实例提供给用户使用,它包括 GN5i提供两块 P4的卡,GN6i提供4块 T4的卡,GN6v提供8块v100的计算实例,v100之间是通过 NVLink 互联的,

主要适合于做深度学习、强化学习场景包括计算机视觉,图像合成,语音识别,语音合成,自然语言理解,机器翻译,自动驾驶等等;

X-Dragon(神龙)Hypervisor,神龙架构可以通过神龙罗金属的方式把 GPU 的计算能力和 CPU 的计算能力完全没有驯化的方式提供给用户使用,用户使用的是完全没有损失的 GPU 和 CPU,

在 ebmGN6i 的实例上提供了4块 T4的计算卡,在 SCC 的实例上提供了8块 V100的 NVLink 互联的卡,提供了50Gb的 RDMA 互联,在 SCCGN6ne 的实例上,提供了8块32GB 显存的V100,100Gb RDMA 互联。RDMA 的互联能力是要比T4的强很多的,延迟可以降低一个数量级。比较适合大规模深度学习,比如大规模分布式训练、推理以及在线机器学习。算力的要求,对实施性的要求都非常高。


五、基于阿里云异构计算的AI应用架构

image.png

在 IaaS 资源层,可以基于阿里云创建出 GPU 云服务器的计算资源以及 TCP、RDMA 网络的网络资源;

用户自己用主流的计算框架层,比如 Tensorflow、PyTorch、MXNET、Caffe 做计算框架;

在应用层,用这些框架搭建视觉服务或者 CTR 服务,自然语言理解或者语音识别的服务。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
8天前
|
自然语言处理 JavaScript Java
《鸿蒙HarmonyOS应用开发从入门到精通(第2版)》学习笔记——HarmonyOS架构介绍
HarmonyOS采用分层架构设计,从下至上分为内核层、系统服务层、框架层和应用层。内核层支持多内核设计与硬件驱动;系统服务层提供核心能力和服务;框架层支持多语言开发;应用层包括系统及第三方应用,支持跨设备调度,确保一致的用户体验。
123 81
|
5天前
|
人工智能 运维 监控
云卓越架构:企业稳定性架构体系和AI业务场景探秘
本次分享由阿里云智能集团公共云技术服务部上海零售技术服务高级经理路志华主讲,主题为“云卓越架构:企业稳定性架构体系和AI业务场景探秘”。内容涵盖四个部分:1) 稳定性架构设计,强调高可用、可扩展性、安全性和可维护性;2) 稳定性保障体系和应急体系的建立,确保快速响应和恢复;3) 重大活动时的稳定重宝策略,如大促或新业务上线;4) AI在企业中的应用场景,包括智能编码、知识库问答、创意广告生成等。通过这些内容,帮助企业在云计算环境中构建更加稳定和高效的架构,并探索AI技术带来的创新机会。
|
6天前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
1月前
|
机器学习/深度学习 人工智能 并行计算
【AI系统】Kernel 层架构
推理引擎的Kernel层负责执行底层数学运算,如矩阵乘法、卷积等,直接影响推理速度与效率。它与Runtime层紧密配合,通过算法优化、内存布局调整、汇编优化及调度优化等手段,实现高性能计算。Kernel层针对不同硬件(如CPU、GPU)进行特定优化,支持NEON、AVX、CUDA等技术,确保在多种平台上高效运行。
84 32
|
1月前
|
存储 机器学习/深度学习 人工智能
【AI系统】计算图优化架构
本文介绍了推理引擎转换中的图优化模块,涵盖算子融合、布局转换、算子替换及内存优化等技术,旨在提升模型推理效率。计算图优化技术通过减少计算冗余、提高计算效率和减少内存占用,显著改善模型在资源受限设备上的运行表现。文中详细探讨了离线优化模块面临的挑战及解决方案,包括结构冗余、精度冗余、算法冗余和读写冗余的处理方法。此外,文章还介绍了ONNX Runtime的图优化机制及其在实际应用中的实现,展示了如何通过图优化提高模型推理性能的具体示例。
57 4
【AI系统】计算图优化架构
|
28天前
|
机器学习/深度学习 人工智能
一个模型走天下!智源提出全新扩散架构OmniGen,AI生图进入一键生成时代
智源研究院推出OmniGen,一种全新的扩散模型,旨在克服现有图像生成模型的局限性。OmniGen能处理文本到图像、图像编辑等多任务,具备高效、简洁的架构,仅含VAE和预训练Transformer。通过大规模统一数据集X2I训练,OmniGen展现了强大的多任务处理能力和知识转移能力,适用于虚拟试穿、图像修复等多个领域。尽管如此,OmniGen在特定任务上的性能、训练资源需求及可解释性等方面仍面临挑战。
41509 20
|
16天前
|
机器学习/深度学习 存储 人工智能
基于AI的实时监控系统:技术架构与挑战分析
AI视频监控系统利用计算机视觉和深度学习技术,实现实时分析与智能识别,显著提升高风险场所如监狱的安全性。系统架构包括数据采集、预处理、行为分析、实时决策及数据存储层,涵盖高分辨率视频传输、图像增强、目标检测、异常行为识别等关键技术。面对算法优化、实时性和系统集成等挑战,通过数据增强、边缘计算和模块化设计等方法解决。未来,AI技术的进步将进一步提高监控系统的智能化水平和应对复杂安全挑战的能力。
|
1月前
|
存储 人工智能 监控
【AI系统】推理系统架构
本文深入探讨了AI推理系统架构,特别是以NVIDIA Triton Inference Server为核心,涵盖推理、部署、服务化三大环节。Triton通过高性能、可扩展、多框架支持等特点,提供了一站式的模型服务解决方案。文章还介绍了模型预编排、推理引擎、返回与监控等功能,以及自定义Backend开发和模型生命周期管理的最佳实践,如金丝雀发布和回滚策略,旨在帮助构建高效、可靠的AI应用。
107 15
存储 人工智能 自然语言处理
73 6
|
1月前
|
机器学习/深度学习 人工智能 API
【AI系统】昇腾异构计算架构 CANN
本文介绍了昇腾 AI 异构计算架构 CANN,涵盖硬件层面的达·芬奇架构和软件层面的全栈支持,旨在提供高性能神经网络计算所需的硬件基础和软件环境。通过多层级架构,CANN 实现了高效的 AI 应用开发与性能优化,支持多种主流 AI 框架,并提供丰富的开发工具和接口,助力开发者快速构建和优化神经网络模型。
43 1

热门文章

最新文章