开发者社区 > 阿里云实时计算Flink > 视频 > 正文

AI技术分享会第十期 | 基于HLO的全自动分布式系统—TePDist

发布者:Dev-Talk 2023-05-05 10:53:42 9318
视频介绍

阿里云机器学习平台PAI团队自研的于HLO的全自动分布式系统——TePDist。该系统通过在HLO上做分布式策略搜索,实现与用户模型语言解耦。并且在保持通用性的同时,能够在可接受的策略搜索时间内,追求高性能分布式策略。用户无需修改模型主体代码,系统能够全自动地帮助用户做分布式扩展,有效解决了分布式框架长期以来在实际生产场景中手工优化和自动分布式工作存在的诸多性能和效率问题。
PAI与AI开发者共同打造更快更好的基于HLO的全自动分布式系统,全面助力AI大模型发展!
一、分享议题
基于HLO的全自动分布式系统—TePDist
二、直播时间
2023年5月10日(周三)18:00-18:40
三、听众收益

  1. 分布式训练技术
  2. TePDist架构与特点
  3. TePDist自动分布式策略
  4. TePDist分布式执行引擎
  5. TePDist性能展示