备案控制台

开发者社区人工智能文章正文

Transformer 与 Bayesian深度学习

2022-06-16 300

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Transformer 与 Bayesian深度学习

贝叶斯神经网络（Bayesian Neural Network）通过提供不确定来回答“Why Should I Trust You？”这个问题。实现上讲，贝叶斯通过集成深度学习参数矩阵中参数的Uncertainty来驾驭数据的不确定性，提供给具体Task具有置信空间Confidence的推理结构。

一般的神经网络我们称为Point estimation neural networks，通过MLE最大似然估计的方式建立训练的目标函数，为神经网络中的每个参数寻找一个optimal最优值；而贝叶斯深度学习一种把概率分布作为权重的神经网络，通过真实数据来优化参数的概率分布，在训练的过程中会使用MAP最大后验概率集成众多的模型参数的概率分布来拟合各种不确定的情况，提供处理数据不确定性的信息表达框架。

Transformer是一个符合Bayesian深度学习网络的AI架构，尤其是其经典的multi-head self-attention机制，该机制其实采用模型集成的思想来从工程角度落地贝叶斯深度学习网络；基于Prior先验信息的正则化效果，multi-head机制所表达的信息多元化及不确定性能够提供具有高置信度区间的回答 “Why Should I Trust You？” 这一问题

文章标签：

机器学习/深度学习

人工智能

关键词：

深度学习transformer

孙庚辛

目录

相关文章

长梦

|

7月前

|

机器学习/深度学习自然语言处理异构计算

Python深度学习面试：CNN、RNN与Transformer详解

【4月更文挑战第16天】本文介绍了深度学习面试中关于CNN、RNN和Transformer的常见问题和易错点，并提供了Python代码示例。理解这三种模型的基本组成、工作原理及其在图像识别、文本处理等任务中的应用是评估技术实力的关键。注意点包括：模型结构的混淆、过拟合的防治、输入序列长度处理、并行化训练以及模型解释性。掌握这些知识和技巧，将有助于在面试中展现优秀的深度学习能力。

长梦

248 11 11

代码bug生产队

|

1月前

|

机器学习/深度学习自然语言处理并行计算

深入理解深度学习中的Transformer模型

深入理解深度学习中的Transformer模型

代码bug生产队

55 1 1

Star时光

|

1月前

|

机器学习/深度学习人工智能自然语言处理

探索深度学习中的Transformer模型

探索深度学习中的Transformer模型

Star时光

37 1 1

欲揽西江月

|

26天前

|

机器学习/深度学习自然语言处理并行计算

探索深度学习中的Transformer模型：原理、优势与应用

探索深度学习中的Transformer模型：原理、优势与应用

欲揽西江月

77 0 0

小周sir

|

26天前

|

机器学习/深度学习人工智能自然语言处理

探索深度学习与自然语言处理的前沿技术：Transformer模型的深度解析

探索深度学习与自然语言处理的前沿技术：Transformer模型的深度解析

小周sir

82 0 0

小周sir

|

26天前

|

机器学习/深度学习自然语言处理语音技术

探索深度学习中的Transformer模型及其在自然语言处理中的应用

探索深度学习中的Transformer模型及其在自然语言处理中的应用

小周sir

44 0 0

代码bug生产队

|

27天前

|

机器学习/深度学习人工智能自然语言处理

揭秘深度学习中的自注意力机制及其在Transformer模型中的应用

揭秘深度学习中的自注意力机制及其在Transformer模型中的应用

代码bug生产队

65 0 0

程序员成长之路

|

1月前

|

机器学习/深度学习人工智能自然语言处理

探索深度学习的最新进展：Transformer模型的创新应用

探索深度学习的最新进展：Transformer模型的创新应用

程序员成长之路

69 0 0

Star时光

|

1月前

|

机器学习/深度学习自然语言处理计算机视觉

探索深度学习中的Transformer架构

探索深度学习中的Transformer架构

Star时光

41 0 0

人物我非-32022

|

2月前

|

机器学习/深度学习自然语言处理并行计算

深度学习之光：Transformer模型详解

【10月更文挑战第7天】

人物我非-32022

82 1 1

热门文章

最新文章

领域最全 | 计算机视觉算法在路面坑洼检测中的应用综述(基于2D图像/3D LiDAR/深度学习)（上）

Facebook这样看“深度学习”技术

如何从系统层面优化深度学习计算？

智能扑克牌识别软件（Python+YOLOv5深度学习模型+清新界面）

云栖科技评论第15期：IBM联合NVIDIA开发世界上“最快商用深度学习系统”

IBM：最新突破将大幅提升深度学习速度

深度学习caffe实践学习

【Jetson Xavier NX 开发板深度学习环境配置流程】

深度学习基础：标量、向量、矩阵、张量

深度学习学习资料

揭秘深度学习在图像识别中的核心技术与挑战

深度学习在图像识别中的应用与挑战

深度学习在图像识别中的应用与挑战

深度学习在图像识别中的应用与挑战

深度学习在图像识别中的应用与挑战

基于深度学习的图像识别技术在智能监控系统中的应用

深度学习在图像识别中的应用与挑战

基于深度学习的图像识别技术在自动驾驶系统中的应用

深度学习在图像识别中的应用与挑战

构建高效AI系统：深度学习优化技术解析

相关课程

更多

高校精品课-复旦大学-机器学习与深度学习

深度学习框架TensorFlow入门

深度学习与自动驾驶

神经网络与深度学习

机器学习集成学习与模型融合

深度学习理论与实战（基于TensorFlow实现）

相关电子书

更多

深度学习的最新进展

搜狗深度学习技术在广告推荐领域的应用

深度学习在电商搜索和聊天机器人中的应用

相关实验场景

更多

如何快速训练大模型

推荐系统入门之使用ALS算法实现打分预测

下一篇

DataWorks售前咨询