备案控制台

开发者社区> 问答> 正文

训练万亿/10万亿参数的M6模型时，EPL框架如何实现算力需求的降低？

训练万亿/10万亿参数的M6模型时，EPL框架如何实现算力需求的降低？

展开

收起

萝卜丝丸子 2024-08-05 21:46:57 12 0

1 条回答

写回答

取消提交回答

宇宙超级无敌霸王龙

为了降低训练万亿/10万亿参数M6模型的算力需求，EPL框架中实现了MoE(Mixture-of-Experts)结构。MoE通过稀疏激活的特点，使用Gating(Router)为输入选择Top-k的expert进行计算，从而大大减少算力需求。此外，EPL还支持专家并行(EP)，将experts拆分到多个devices上，进一步降低单个device的显存和算力需求。

2024-08-05 22:08:36

赞同 2 展开评论打赏

问答地址：

开发者社区 > 云计算 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

55054

28

0

企业邮箱

8550

6

0

this xml file does not appear to have any style in

28522

8

0

如果购买了域名，一定要备案才能用吗

35890

34

0

OSS的endpoint如何查看

29326

3

0

com/action/joingroup?code=v1是什么意思

204594

19

0

有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎？

91658

16

0

什么是二进制？二进制怎么算？

37121

40

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

227407

10

0

ssl免费证书

4475

2

0

问答排行榜

最热

最新

1 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818993

2 据说在家办公的程序员是这样写代码的？ 1793112

3 阿里云开放端口权限 690258

4 如何升级配置 536288

5 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522842

6 【精品问答】python技术1000问(1) 514124

7 Flink Forward Asia 2021 有奖问答 512903

8 OceanBase 使用动画（持续更新） 359371

9 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329801

10 OSS存储服务-客户端工具 321566

11 为体验实验室取一个新名字。 307475

12 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 304078

13 Win Server 2003-2016 加密勒索事件必打补丁合集 295327

14 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 284196

15 安全组详解，新手必看教程 277341

16 写code还是做管理，开发者如何进行职业规划？ 269126

17 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255880

18 阿里云手机和阿云浏览器连接问题专帖 235686

19 支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】 227304

20 请问阿里云邮箱如何开启SMTP服务啊！ 225862

1 AI宠物更适合当代年轻人的陪伴需求吗？ 372

2 AI客服未来会完全代替人工吗？ 447

3 “云+AI”能够孵化出多少可能？ 683

4 当AI频繁生成虚假信息，我们还能轻信大模型吗？ 507

5 使用免费证书后服务器浏览器访问没有问题，外网访问显示证书不可信，使用同一种浏览器哦 104

6 FFA 2024 大会门票免费送！AI时代下大数据技术未来路在何方？ 1310

7 为什么宜搭的流程流入到钉钉OA审批，钉钉OA审批要收钱啊。。。。 118

8 AI时代，存力or算力哪一个更关键？ 1144

9 求宜搭关联表单的更新方法！！！ 257

10 全网寻找 #六边形战士# 程序员，你的 AI 编码助手身份标签是什么？ 1197

11 老哥们有个需求想请教一下，十分感谢 249

12 关于“通义灵码”而言，这次更新后，他更加人性化，然而我更喜欢fittencode,理由如下 294

13 flink1.20.0 部署后发布报错，是怎么回事，各种配置都配置了 136

14 关于开发者的100件小事，你知道哪些？ 1212

15 AI助力，短剧迎来创新热潮？ 960

16 "ModelScope默认的下载位置是在哪里？ 427

17 OSS命令行工具ossutil使用问题 156

18 1024程序员节，开发者们都在参与社区的哪些活动？ 2579

19 关于文本框校验自定义函数的问题 531

20 执行docker search nginx 报错超时 427

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

低代码开发师（初级）实战教程 立即下载

冬季实战营第三期：MySQL数据库进阶实战 立即下载

阿里巴巴DevOps 最佳实践手册 立即下载