异构加速平台Heterogeneity-Aware Lowering and Optimization (HALO)简介-阿里云开发者社区

异构加速平台Heterogeneity-Aware Lowering and Optimization (HALO)简介

2021-08-13 2030

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： HALO是异基于编译器的异构加速平台。它通过称为开放深度学习 API ( ODLA )的抽象、可扩展接口来利用针对深度学习领域的异构计算能力。HALO 提供统一的 Ahead-Of-Time 编译解决方案，自动为云、边缘和物联网场景量身定制。

Heterogeneity-Aware Lowering and Optimization (HALO)是异构计算加速度基于编译器的技术平台。

它通过称为开放深度学习 API ( ODLA )的抽象、可扩展接口来利用针对深度学习领域的异构计算能力。HALO 提供统一的 Ahead-Of-Time 编译解决方案，自动为云、边缘和物联网场景量身定制。

HALO 支持多种编译模式。在提前（AOT）编译模式下，HALO 将 AI 模型编译成用 ODLA API 编写的 C/C++ 代码。编译后的模型可以在具有相应 ODLA 运行时库的任何受支持平台上运行。此外，HALO 能够同时编译主机和异构设备代码。

下图为整体编译流程：

HALO 支持从以下框架编译模型：

咖啡
ONNX
TensorFlow
TFLite

很快将支持更多框架。

HALO 通过其HgAI SDK支持阿里巴巴的第一款 AI 推理芯片：Hanguang-800 NPU。含光800 NPU由阿里巴巴集团旗下企业T-Head Semiconductor Co., Ltd.（又名PingTouGe）设计。

通过针对各种异构加速器/运行时的 ODLA 运行时库集支持广泛的 ODLA 生态系统：

我们欢迎新的加速器平台加入 ODLA 社区。

ODLA API 参考可以在这里找到，详细的编程指南即将推出...

伙伴

我们感谢以下合作伙伴对 ODLA 运行时的支持：

如何使用光环

要构建 HALO，请按照此处的说明进行操作。

使用 HALO 部署模型的工作流程包括：

使用 HALO 将模型文件编译为基于 ODLA 的 C/C++ 源文件。
使用 C/C++ 编译器将生成的 C/C++ 文件编译为目标文件。
将目标文件、权重二进制文件和特定的 ODLA 运行时库链接在一起。

一个简单的例子

让我们从一个基于TensorFlow Tutorial的 MNIST 的简单示例开始。下图显示了整体工作流程：

简要说明：

HALO 生成 3 个文件：

mnist.h ：应用程序要使用的头文件。
mnist.cc ：代表模型的 ODLA C++ 文件。
mnist.bin : ELF 格式的权重。

对于应用程序，推理被简单地视为一个函数调用mnist()。

请注意，出于可移植性的目的，即使输出文件 model.cc 是 C++ 格式，HALO 也始终以 C 约定导出函数。

更详细的解释可以在这里找到。示例代码可以在这里找到

有关所有命令行选项，请参阅HALO 选项列表。

贡献

我们一直在寻求帮助以改进 HALO。有关更多详细信息，请参阅贡献指南。谢谢！

资源

执照

HALO 在Apache 2.0 许可下获得许可

异构加速平台Heterogeneity-Aware Lowering and Optimization (HALO)简介

伙伴

如何使用光环

一个简单的例子

更多例子

贡献

资源

执照

阿里开源

热门文章

最新文章

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

异构加速平台Heterogeneity-Aware Lowering and Optimization (HALO)简介

伙伴

如何使用光环

一个简单的例子

更多例子

贡献

资源

执照

阿里开源

热门文章

最新文章

相关电子书

相关实验场景