【AI系统】代数简化

简介: 代数简化是一种基于数学原理优化计算图的技术,通过调整算子执行顺序或删除冗余算子来提升计算效率。主要方法包括算术简化(利用代数法则如交换律、结合律等优化运算符顺序)、运行简化(减少冗余的算子操作,如对合算子和幂等算子的化简)和广播简化(优化不同形状张量间的广播运算)。这些方法共同作用,旨在减少计算资源消耗,加速计算过程。

代数简化(Algebraic Reduced)是一种从数学上来指导我们优化计算图的方法。其目的是利用交换率、结合律等规律调整图中算子的执行顺序,或者删除不必要的算子,以提高图整体的计算效率。

代数化简可以通过子图替换的方式完成,具体实现:1)可以先抽象出一套通用的子图替换框架,再对各规则实例化。2)可以针对每一个具体的规则实现专门的优化逻辑。下面我们将介绍三种不同的代数简化方案。

算术简化

顾名思义,算术化简就是通过利用代数之间算术运算法则,在计算图中可以确定优化的运算符执行顺序,从而用新的运算符替换原有复杂的运算符组合。我们给出结合律,分配律,交换律的例子。

结合律

非正式的讲,结合律是说: 不论我们怎样结合数字(即先计算那些数字),答案都是一样的。即:

(a+b)+c=a+(b+c)

形式化的讲,令 是非空集合 S 上的二元运算,如果 x,y,zS,都有

(xy)z=x(yz)

则称运算 S 上是可结合的,或者说运算 S 上满足结合律

根据这样的思想,我们可以发现以下的规则符合结合律,令 A,B,C 是张量集合 Γ 的元素,即 A,B,CΓ,则有

(AB)1((AB)C)1(AB)2C

其中 是卷积 Conv, 是矩阵乘法 Mul;形式上讲,我们称上述公式为在张量集合 Γ 上的二元运算 满足结合律。

有了这样的规则,便可以指导我们进行实例的优化,例如下面的实例算子,令 A,B,C 为具体的张量,其他算子均为图示,优化规则如上所述:

结合律

根据上述结合律规则,我们可以把 A 与 B 的卷积给抽离出来,讲红色方框部分做简化,这样我们就减少运算算子,也减少了运算开销。

当然还有许多符合结合律的化简,我们列几个在下方供读者参考。

Recip(A)Recipe(AB)Square(Recip(A))B(AB)(BC)ABC(AReduceSum(B))(ReduceSum(B)C)ASquare(ReduceSum(B))C

交换律

交换律是说:我们可以把数的位置对换而答案不变,即:

a+b=b+cab=ba

形式化的讲,令 是非空集合 S 上的二元运算,如果 x,yS,都有

xy=yx

则称运算 S 上是可交换的,或者说运算 S 上满足交换律

根据这样简洁优美的思想,我们可以发现以下的规则符合结合律:

ReduceSum(BitShift(A))BitShift(ReduceSum(A))

根据这样的规则我们可以看到如下实例的优化:

交换律

如图所示,A 是一个张量,相比较先位移再 ReduceSum 的操作顺序,我们可以根据结合律,先 ReduceSum,得到一个维度更小的 batch,再进行 BitShift,显然运算的开销减少了。

当然还有许多符合交换律的化简,我们列几个在下方供读者参考。

ReduceProd(Exp(A))Exp(ReduceSum(A))

分配律

分配律简化,即

a(b+c)=(ac)+(ab)

形式化的讲,令 是非空集合 S 上的二元运算,如果 x,y,zS

x(yz)=(xy)(xz)(yz)x=(yx)(zx)

则称运算 S 上是可分配的,或者说运算 S 上满足分配律

这个公式从右往左的过程也可以称为提取公因式。根据上述思想,我们可以发现以下的规则符合分配律:

(AB)C+(AB)D(AB)(C+D)

根据这样的规则我们可以看到如下实例的优化:

分配律

我们会发现,AB 之后与 C,D 分别做乘法操作时没有必要的,于是可以提取公因式,将 C,D 单独加和再做乘法,将 4 次算子操作降低为 3 次操作,减少了运算开销。

当然还有许多符合分配律的化简,我们列几个在下方供读者参考。

A+ABA(B+1)Square(A+B)(A+B)C(A+B)(A+BC)

注:当我们做代数简化时,一定要先注意到算子是否符合例如交换律,结合律等规则,例如矩阵乘法中 ABBA

最后,我们向大家推荐一篇关于算术简化规则的文章:

DNNFusion: accelerating deep neural networks execution with advanced operator fusion.

其中还包括更多复杂的简化规则供读者参考。

DNNFusion

运行简化

运算简化,是减少运算或执行时,冗余的算子或者算子对;我们给出两种规则来解释。

  • 逆函数等于其自身函数的对合算子化简:

    f(f(x))=xf(x)=f1(x)

    例如取反操作:(x)=x,倒数,逻辑非,矩阵转置(以及你键盘中英文切换,当你快速按下两次切换的时候,你会发现什么都没有发生,当然次数太多就不一定了)等。

  • 幂等算子化简,即作用再某一元素两次与一次相同:

    f(f(x))=f(x)

    一个具体的实例如下:

    Reshape(Reshape(x,shape1),shape2)Reshape(x,shape2)

    其中,Shape2 的大小小于 Shape1

我们用图来展示上述两中运行化简:

对合算子

如图所示,对于对合算子 Op1,两次对合后,根据对合性质可得等价于没有操作,所以运行化简后只剩下 Op2。

幂等算子

如图所示,对于幂等算子 Op1,多个幂等算子等价与一次操作,于是运行化简后等价与一个 Op1 算子。

广播简化

当多个张量形状 Shape 不同情况下,需要进行广播(broadcast)将张量的形状拓展为相同 shape 再进行运算,化简为最小计算所需的广播运算数量。

我们还是以一个简单的例子为准,考虑以下 2 个矩阵与 2 个向量的相加:

(S1+Mat1)+(S2+Mat2)(S1+S2)+(Mat1+Mat2)

BroadcastExample

假设矩阵的维度为 4,则一个向量与 4 维矩阵相加时,要先广播为 4 维,再与 Mat 相加,显然左式需要广播两次;但我们可以通过位置替换,将两个向量首先相加再广播,此时就节省了一个广播的开销,达到我们优化的目的。

如果您想了解更多AI知识,与AI专业人士交流,请立即访问昇腾社区官方网站https://www.hiascend.com/ 或者深入研读《AI系统:原理与架构》一书,这里汇聚了海量的AI学习资源和实践课程,为您的AI技术成长提供强劲动力。不仅如此,您还有机会投身于全国昇腾AI创新大赛和昇腾AI开发者创享日等盛事,发现AI世界的无限奥秘~

目录
打赏
0
相关文章
【最佳实践系列】AI程序员让我变成全栈:基于阿里云百炼DeepSeek的跨语言公告系统实战
本文介绍了如何在Java开发中通过跨语言编程,利用阿里云百炼服务平台的DeepSeek大模型生成公告内容,并将其嵌入前端页面。
算法系统协同优化,vivo与港中文推出BlueLM-V-3B,手机秒变多模态AI专家
BlueLM-V-3B是由vivo与香港中文大学共同研发的多模态大型语言模型,专为移动设备优化。它通过算法和系统协同优化,实现了高效部署和快速生成速度(24.4 token/s),并在OpenCompass基准测试中取得优异成绩(66.1分)。模型小巧,语言部分含27亿参数,视觉编码器含4000万参数,适合移动设备使用。尽管如此,低端设备可能仍面临资源压力,实际应用效果需进一步验证。论文链接:https://arxiv.org/abs/2411.10640。
37 9
Memobase:开源AI长期记忆系统,让AI真正记住每个用户的秘密武器
Memobase 是一个开源的长期记忆系统,专为生成式 AI 应用设计,通过用户画像和时间感知记忆功能,帮助 AI 记住、理解并适应用户需求。
100 0
AI对话网站一键生成系统源码
可以添加进自己的工具箱,也可以嵌入自己博客的页面中,引流效果杠杠的,新拟态设计风格,有能力的大佬可以进行二开,仅提供学习,用户可输入网站名称、AI默认的开场白、AI头像昵称、AI网站中引流的你的网站等等内容,所有生成的网页全部保存到你的服务器上
64 27
AI对话网站一键生成系统源码
AI实践:智能工单系统的技术逻辑与应用
智能工单系统是企业服务管理的核心工具,通过多渠道接入、自然语言处理等技术,实现工单自动生成、分类和分配。它优化了客户服务流程,提高了效率与透明度,减少了运营成本,提升了客户满意度。系统还依托知识库和机器学习,持续改进处理策略,助力企业在竞争中脱颖而出。
171 5
校企合作|TsingtaoAI携手潍坊学院,共建AI驱动的党建信息化系统
TsingtaoAI与潍坊学院近日达成合作,正式签署《人工智能党建信息化系统开发》技术开发合同,计划在未来两年内联合开发一套集党员教育、党务管理、党建活动智能化以及数据可视化于一体的智能党建系统。本次合作将充分结合TsingtaoAI在AI大模型领域的技术优势和潍坊学院的学术资源,为推动党建工作的数字化、智能化和高效化注入新的动力。
69 10
Casevo:开源的社会传播模拟系统,基于 AI 模拟人类认知、决策和社会交互,预测社会传播现象
Casevo 是中国传媒大学推出的开源社会传播模拟系统,结合大语言模型和多智能体技术,支持复杂社会网络建模与动态交互,适用于新闻传播、社会计算等领域。
144 22
Casevo:开源的社会传播模拟系统,基于 AI 模拟人类认知、决策和社会交互,预测社会传播现象
AigcPanel:开源的 AI 虚拟数字人系统,一键安装开箱即用,支持视频合成、声音合成和声音克隆
AigcPanel 是一款开源的 AI 虚拟数字人系统,支持视频合成、声音克隆等功能,适用于影视制作、虚拟主播、教育培训等多种场景。
451 12
AigcPanel:开源的 AI 虚拟数字人系统,一键安装开箱即用,支持视频合成、声音合成和声音克隆

热门文章

最新文章