备案控制台

开发者社区云计算文章正文

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（7）

2024-06-29 10

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 阿里云瑶池数据库云原生化和一体化产品能力升级，多款产品更新迭代

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（6）https://developer.aliyun.com/article/1554146

上图展示的是我们在做一些模型微观性能分析时看到的一些状况，上面是典型的Tranformer 结构，包含了像 attention 结构和 MLP 结构。在这些算子里面，我们通过微观的分析可以看到，大部分的计算都是矩阵乘运算，就是 GEMM 的操作，实际有 85% 的耗时都是访存，主要是去做显存的读取。

大模型推理本身是自回归的方式，上一个生成出来的 token 会用在下一个 token 的计算，基本都是访存密集型计算。总结来说基于这些行为，在优化时我们会把 attention 结构的许多算子以及 MLP 的算子分别融合成大的算子，这样会显著提高计算效率。

在大模型推理带宽需求方面，以 LLaMA 7B 在 A10 或者 A100 上的对比为例：如上图，红色曲线代表的是 A100 VS A10 QPS 的比例关系，在不同 batchsize 下，红色曲线基本上是一条水平的线，这从侧面印证了大模型推理基本是一个访存密集型的操作，它的上限是由 GPU 的 HBM 显存带宽决定的。

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（8）https://developer.aliyun.com/article/1554144

文章标签：

人工智能

C++

Cloud Native

异构计算

数据库

技术工程师

目录

相关文章

阿里云基础设施.

|

10月前

|

人工智能运维监控

AI时代云基础设施的技术创新与展望丨ODCC2023

AI时代云基础设施的技术创新与展望丨ODCC2023

阿里云基础设施.

909 0 0

阿里云基础设施.

|

2月前

|

人工智能弹性计算算法

一文解读：阿里云AI基础设施的演进与挑战

一文解读：阿里云AI基础设施的演进与挑战

阿里云基础设施.

199 1 1

技术工程师

|

2天前

|

人工智能弹性计算 Cloud Native

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（1）

阿里云瑶池数据库云原生化和一体化产品能力升级，多款产品更新迭代

技术工程师

12 2 2

技术工程师

|

2天前

|

人工智能 Cloud Native 数据库

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（8）

阿里云瑶池数据库云原生化和一体化产品能力升级，多款产品更新迭代

技术工程师

13 2 2

技术工程师

|

2天前

|

人工智能 Cloud Native 数据库

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（3）

阿里云瑶池数据库云原生化和一体化产品能力升级，多款产品更新迭代

技术工程师

12 1 1

技术工程师

|

2天前

|

人工智能 Cloud Native 算法

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（6）

阿里云瑶池数据库云原生化和一体化产品能力升级，多款产品更新迭代

技术工程师

11 1 1

技术工程师

|

2天前

|

人工智能 Cloud Native 数据库

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（2）

阿里云瑶池数据库云原生化和一体化产品能力升级，多款产品更新迭代

技术工程师

11 1 1

技术工程师

|

2天前

|

存储人工智能 Cloud Native

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（5）

阿里云瑶池数据库云原生化和一体化产品能力升级，多款产品更新迭代

技术工程师

12 1 1

技术工程师

|

2天前

|

人工智能算法 Cloud Native

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（4）

阿里云瑶池数据库云原生化和一体化产品能力升级，多款产品更新迭代

技术工程师

11 1 1

技术工程师

|

2天前

|

人工智能 Cloud Native 数据库

《阿里云产品四月刊》—一文解读：阿里云 AI 基础设施的演进与挑战（10）

阿里云瑶池数据库云原生化和一体化产品能力升级，多款产品更新迭代

技术工程师

9 0 0

热门文章

最新文章

无法初始化SFTP协议。主机是SFTP服务器吗

CentOS6、7编译安装FFmpeg

UI自动化测试分析与实践 | F2etest&UIRecorde

MySQL无损复制

阿里云客服电话人工服务

ADB工具包15秒快速安装器，已集合ADB、FASTBOOT工具箱和最新的驱动程序

php求今天零点的时间缀

Azure Backup (2) Azure备份服务

两条报警信息的分析（第二篇)

Oracle ORA-12899

实现权限控制的方法

正则表达式替换字符串的方法

了解SENT协议及其应用

配置applicationContext.xml文件

使用OutputStreamWriter写入数据

使用notifyAll唤醒所有等待线程

CRM报表在企业中的应用：分析工具与报告自动化

Spring Boot导购电商返利App架构设计

定义和使用Quartz调度表达式

Oracle游标的定义与使用

相关课程

更多

AIGC无处不在，把AI应用构建于Serverless之上

视觉AI技术体系及趋势概述

使用Higress AI网关优化AI调用成本

阿里云DAS-您的专属AI专家，引领数据库自治驾驶

企业上云攻略-阿里云网络产品应用系列教程

AI社区开源学习实践

相关电子书

更多

AI+云：云上服务新趋势

阿里视觉AI开放之路：从公共云走向端云协同

云原生机器学习平台助力提升AI研发效能

相关实验场景

更多

函数计算部署AI艺术字应用，生成新春文字头像

阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用

基于通义千问X函数计算部署AI助手

基于阿里云E-HPC平台的WRF气象预报实验

基于阿里云DeepGPU实例，让AI带你畅玩杭州

基于阿里云DeepGPU实例，用AI画唯美国风少女

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）