备案控制台

开发者社区大淘宝技术文章正文

带你读《2022技术人的百宝黑皮书》——淘宝逛逛ODL模型优化总结(4)

2023-06-12 97

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 带你读《2022技术人的百宝黑皮书》——淘宝逛逛ODL模型优化总结(4)

带你读《2022技术人的百宝黑皮书》——淘宝逛逛ODL模型优化总结(3) https://developer.aliyun.com/article/1246919?groupCode=taobaotech

全连接网络优化

背景

全连接网络是深度模型中非常常见的一种结构，其基本形式就是矩阵乘法Matmul、矩阵加法BiasAdd及激活函数LeakyRelu。在TensorFlow 1.x中，全连接网络的实现使用的是keras.layers.Dense类。其中当inputs的rank大于2时，调用的是standard_ops.tensordot接口。

@tf_export('keras.layers.Dense')
class Dense(Layer):
 ……
 def call(self, inputs):
 inputs = ops.convert_to_tensor(inputs, dtype=self.dtype)
 rank = common_shapes.rank(inputs)
 if rank > 2:
 # Broadcasting is required for the inputs.
 outputs = standard_ops.tensordot(inputs, self.kernel, [[rank - 1], [0]])
 ……

通过tensordot代码可以看出，其生成的tf图是非常复杂的，而且还包含了Gather这样与Cuda Graph不兼容的算子。这不仅会增加全连接网络的调用成本，还会使得Cuda Graph对全连接网络的优化十分受限。我们使用Netron对TensorFlow的原生全连接网络进行了可视化，可以很明显地看出，全连接网络的结构十分的复杂。

带你读《2022技术人的百宝黑皮书》——淘宝逛逛ODL模型优化总结(5) https://developer.aliyun.com/article/1246917?groupCode=taobaotech

文章标签：

算法框架/工具

数据可视化

并行计算

TensorFlow

编程技术君

目录

相关文章

编程技术君

|

算法调度语音技术

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（6）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（6）

编程技术君

85 0 0

编程技术君

|

UED

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（8）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（8）

编程技术君

73 0 0

编程技术君

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（9）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（9）

编程技术君

81 0 0

编程技术君

|

UED

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（5）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（5）

编程技术君

79 0 0

编程技术君

|

搜索推荐视频直播

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（4）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（4）

编程技术君

114 0 0

编程技术君

|

容器

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（2）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（2）

编程技术君

77 0 0

编程技术君

|

存储

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（10）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（10）

编程技术君

95 0 0

编程技术君

|

定位技术

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（7）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（7）

编程技术君

81 0 0

编程技术君

|

UED

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（3）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（3）

编程技术君

81 0 0

编程技术君

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（1）

带你读《2022技术人的百宝黑皮书》——淘宝长辈模式技术实践万字总结（1）

编程技术君

80 0 0

大淘宝技术

热门文章

最新文章

Flutter之禅内存优化篇

《Cadence 16.6电路设计与仿真从入门到精通》——2.4 Design Entry CIS原理图图形界面　

记一次对网络抖动经典案例的分析

国外成人网站xHamster大量用户信息黑市变卖，部分账号涉及英美政府官员

用户密码以BCrypt加密的方式来防范被破解

带你理清CPU，cache和存储器之间的逻辑运作

Git设置代理服务器

【DSW Gallery】PAI-DSW开通及授权

吐血整理：机器学习的30个基本概念，都在这里了（手绘图解）

MOSS站点的迁移(备份还原)

设计模式之 5 大创建型模式，万字长文深剖，近 30 张图解！

《C++新特性：为多线程数据竞争检测与预防保驾护航》

Kotlin - 区间与数组

Kotlin - 参数与异常

Kotlin - 运算符与中缀表达式

Kotlin - 函数与Lambda表达式

Kotlin - 分支与循环

天气预报1天-中国气象局-地址查询版免费API接口教程

《C++智能合约与区块链底层交互全解析：构建坚实的去中心化应用桥梁》

相关课程

更多

跨越N次元一键变身AI漫画人

阿里小蜜中的机器阅读技术

人人都能学｜AI大模型应用搭建

【新人赛】工业蒸汽量预测建模算法代码开源分享合集

人人都能学｜AI大模型通识课程

基于通义灵码实现高效 AI 编码

相关电子书

更多

长安十二时辰背后的技术密集——从智能算法到音视频创新技术

亿级视频广告事件预测系统构建之道

亿级广告事件预测系统构建之道

相关实验场景

更多

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

以电商场景为例搭建AI语义搜索应用

奥运时刻！零代码生成奥运风格AI写真。

【AI破次元壁合照】少年白马醉春风，函数计算一键部署AI绘画平台

倚天大数据电商数据分析快速实践

基于阿里云DeepGPU实例，用AI画唯美国风少女

下一篇

阿里云OSS设置跨域访问