BladeDISC 深度学习编译器问题之在动态shape下优化整体性能如何解决-阿里云开发者社区

BladeDISC 深度学习编译器问题之在动态shape下优化整体性能如何解决

2024-08-26 71 发布于山西

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： BladeDISC 深度学习编译器问题之在动态shape下优化整体性能如何解决

问题一：fusion-stitching的基本思想是什么？

fusion-stitching的基本思想是什么？

参考回答：

fusion-stitching的基本思想是利用GPU硬件中低访存开销的shared memory或CPU中低访存开销的Memory Cache，将不同schedule的计算子图缝合进同一个kernel内，实现多个parallel loop复合，从而大幅增加fusion颗粒度，同时避免复杂性及编译开销爆炸。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/674503

问题二：BladeDISC如何保证在动态shape下优化整体性能？

BladeDISC如何保证在动态shape下优化整体性能？

参考回答：

BladeDISC在IR及pass pipeline的设计过程中着重设计了shape constraint的抽象和使用，这些约束关系在编译期未知的不同dimension size之间提供了重要的优化依据。通过这些设计，BladeDISC能够在优化整体性能方面起到明显作用，保证能够足够接近甚至超过静态shape编译器的性能结果。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/674504

问题三：AICompiler框架是如何支持不同前端框架的？

AICompiler框架是如何支持不同前端框架的？

参考回答：

AICompiler框架通过实现轻量的Converter将前端框架的IR（如PyTorch的TorchScript）转换为DHLO IR，从而支持PyTorch等前端框架的推理作业。BladeDISC包含Compiler和Bridge两部分，Bridge以插件形式接入宿主框架，透明化地支持前端计算图，适配用户各种版本的宿主框架。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/674505

问题四：BladeDISC中的RAL层有什么作用？

BladeDISC中的RAL层有什么作用？

参考回答：

RAL层（Runtime Abstraction Layer）实现了多种运行环境的适配支持，包括全图编译独立运行、TF中子图编译运行和PyTorch中子图编译运行。它通过抽象出一套最小集合的API并定义清晰的语义，将编译器与运行时隔离开来，确保编译结果能在不同环境中执行。RAL还实现了无状态编译，简化了代码生成复杂度，支持多线程并发执行和错误处理。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/674506

问题五：BladeDISC的典型应用场景有哪些？

BladeDISC的典型应用场景有哪些？

参考回答：

BladeDISC的典型应用场景包括作为主流硬件平台上的通用、透明的性能优化工具，降低AI作业部署的人力负担，提高模型迭代效率；另一个重要应用场景是帮助新硬件做AI场景的适配和接入支持。它已广泛应用于NLP、机器翻译、语音ASR/TTS、图像检测识别等多种AI应用，覆盖互联网、电商、自动驾驶等多个行业。

关于本问题的更多问答可点击原文查看：

https://developer.aliyun.com/ask/674507

BladeDISC 深度学习编译器问题之在动态shape下优化整体性能如何解决

问题一：fusion-stitching的基本思想是什么？

问题二：BladeDISC如何保证在动态shape下优化整体性能？

问题三：AICompiler框架是如何支持不同前端框架的？

问题四：BladeDISC中的RAL层有什么作用？

问题五：BladeDISC的典型应用场景有哪些？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

BladeDISC 深度学习编译器问题之在动态shape下优化整体性能如何解决

问题一：fusion-stitching的基本思想是什么？

问题二：BladeDISC如何保证在动态shape下优化整体性能？

问题三：AICompiler框架是如何支持不同前端框架的？

问题四：BladeDISC中的RAL层有什么作用？

问题五：BladeDISC的典型应用场景有哪些？

热门文章

最新文章

相关课程

相关电子书

相关实验场景