文档备案控制台

开发者社区问答正文

流水线并行是如何工作的？

流水线并行是如何工作的？

展开

收起

夹心789 2024-07-04 12:06:28 425 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

sunrr

所谓流水线并行，就是由于模型太大，无法将整个模型放置到单张GPU卡中；因此，将模型的不同层放置到不同的计算设备，降低单个计算设备的显存消耗，从而实现超大规模模型训练。

如下图所示，模型共包含四个模型层（如：Transformer层），被切分为三个部分，分别放置到三个不同的计算设备。即第 1 层放置到设备 0，第 2 层和第三 3 层放置到设备 1，第 4 层放置到设备 2。

相邻设备间通过通信链路传输数据。具体地讲，前向计算过程中，输入数据首先在设备 0 上通过第 1 层的计算得到中间结果，并将中间结果传输到设备 1，然后在设备 1 上计算得到第 2 层和第 3 层的输出，并将模型第 3 层的输出结果传输到设备 2，在设备 2 上经由最后一层的计算得到前向计算结果。反向传播过程类似。最后，各个设备上的网络层会使用反向传播过程计算得到的梯度更新参数。由于各个设备间传输的仅是相邻设备间的输出张量，而不是梯度信息，因此通信量较小。

参考文档https://blog.csdn.net/2301_78285120/article/details/132702269

2024-07-06 09:30:41

赞同展开评论
呆呆宝

流水线并行（Pipeline Parallel, PP）是模型的层与层之间的拆分，将不同的层放到不同的GPU上。在计算过程中，必须顺序执行，因为后面的计算过程依赖于前面的计算结果。为了保持流水线并行的高吞吐，需要将一个较大的Batch size切分成多个小Batch。

2024-07-04 13:43:59

赞同展开评论

问答标签：

云效流水线Flow并行

问答地址：

开发者社区 > 云计算 > 问答

相关问答

在云效中通过流水线的webhook接口，通过接口的方式可以发布我所有的服务流水线能否设置并行执行呢？

216

3

0

云效流水线的并行数量限制是多少？

210

1

0

我想在一个云效流水线中选择可部署的服务。这个支持的方案是？多个并行任务？

268

1

0

云效流水线使用云端缓存并行构建的时候会冲突吗？

209

1

0

在云效中在构建ID为1还没完成的情况下，并行执行构建ID 2云效流水线能否支持多个任务并行处理？

172

1

0

云效同一条流水线先后发git master分支和另一个分支，这两分支是对应两套环境，可以并行执行吗？

255

2

0

在云效我是希望并行执行的快一点这样并发就3个也会导致流水线运行不了吗？

141

1

0

云效流水线里的流程，如果有并行的，能不能增加临时禁用的功能？现在只有自动和手动两种模式，但是有的时候

245

1

0

请问下云效怎么配置两次同时触发自动取消上一次？现在是两个都会并行构建流水线。

243

1

0

请问下你们免费版里面的云效流水线最大并行任务数3，运行时长1800分钟/月是啥意思？

498

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云服务器多少钱一年？企业用的配置费用价格

阿里云服务器多少钱一年？学生用的配置价格

个人版用不了，提示：您已达到配额使用上限，请升级订阅计划，以获得更多使用资源。

通义灵码原来说的针对个人用户免费，现在不免费了吗？

部署的独立站点遭遇 CC 攻击时怎么办？

还有其他疑问?