开发者社区人工智能文章正文

遍地开花的 Attention ，你真的懂吗？

2019-07-05 1941

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 各种 Attention ，终于不再迷惑。

曾被 paper 中各种各样的 Attentioin 搞得晕晕乎乎。这里有一份 Attentioin 的PPT，可以帮你快速了解，从此，各种 Attention ，终于不再迷惑。

下载地址：https://102.alibaba.com/downloadFile.do?file=1562049342375/Attention%20%20PPT%20.pdf

文章标签：

人工智能

开发者社区

楠竹11

1月前

机器学习/深度学习人工智能自然语言处理

RNN回归！Bengio新作大道至简与Transformer一较高下

研究团队提出了一种名为“minimal LSTMs and GRUs”的新型RNN模型，通过简化传统LSTM和GRU结构，去除了隐藏状态对输入、遗忘和更新门的依赖，实现了无需BPTT的高效并行训练。该模型不仅保持了RNN处理序列数据的优势，还大幅提升了训练速度，在多个任务上的表现与Transformer相当，同时减少了参数量。研究结果发表于论文《minimal LSTMs and GRUs》。

楠竹11

54 9 9

技术员阿伟

2月前

机器学习/深度学习人工智能自然语言处理

《C++ 中 RNN 及其变体梯度问题的深度剖析与解决之道》

在AI发展浪潮中，RNN及其变体LSTM、GRU在处理序列数据上展现出巨大潜力。但在C++实现时，面临梯度消失和爆炸问题，影响模型学习长期依赖关系。本文探讨了这些问题的根源及解决方案，如梯度裁剪、合理初始化、选择合适激活函数、截断反向传播和优化网络结构等，旨在帮助开发者构建更有效的模型。

技术员阿伟

46 9 10

AI小怪兽

6月前

机器学习/深度学习计算机视觉

YOLOv10实战：SPPF原创自研 | SPPF_attention，重新设计加入注意力机制 | NEU-DET为案列进行展开

【7月更文挑战第1天】优点：为了利用不同的池化核尺寸提取特征的方式可以获得更多的特征信息，提高网络的识别精度；如何优化：在此基础上加入注意力机制，能够在不同尺度上更好的、更多的获取特征信息，从而获取全局视角信息并减轻不同尺度大小所带来的影响； SPPF_attention，重新设计加入注意力机制，在NEU-DEU任务中mAP50从0.683提升至0.703；

AI小怪兽

769 3 3

楠竹11

7月前

机器学习/深度学习自然语言处理算法

原作者带队，LSTM卷土重来之Vision-LSTM出世

【6月更文挑战第14天】Vision-LSTM (ViL) 研究复兴了LSTM在计算机视觉领域的应用，通过xLSTM模型解决了处理大规模图像数据的效率问题。ViL模型采用堆叠的xLSTM块，从不同方向处理图像，增强上下文理解和空间结构捕获，从而在图像分类、目标检测等任务上展现出与Transformer相当甚至更好的性能。尽管存在梯度问题、模型复杂性和潜在替代风险，ViL模型的竞争力和较低的计算复杂度使其在实践中颇具吸引力。[论文链接](https://arxiv.org/abs/2406.04303)

楠竹11

121 2 2

楠竹11

8月前

机器学习/深度学习自然语言处理

Transformer奠基之作《Attention Is All You Need》

Transformer模型，由Google Brain和Google Research在2017年的论文中提出，颠覆了传统NLP依赖RNN和CNN的局面。该模型基于完全的注意力机制，解决了RNN的并行化难题，通过编码器和解码器中的多头自注意力机制捕捉全局依赖。训练策略结合Adam优化器、标签平滑和dropout，使其在机器翻译任务中表现卓越。尽管面临长序列处理的挑战和可能的上下文忽略问题，Transformer仍展示了注意力机制的巨大潜力，对NLP领域产生了深远影响。

楠竹11

154 3 3

Transformer奠基之作《Attention Is All You Need》

5i77ajz5u7ji6

8月前

机器学习/深度学习算法固态存储

MFDS-DETR开源 | HS-FPN多级特征融合+Deformable Self-Attention，再续DETR传奇

5i77ajz5u7ji6

964 0 0

5i77ajz5u7ji6

8月前

机器学习/深度学习编解码数据可视化

即插即用 | 清华大学提出Focused Linear Attention取代Self-Attention成为ViT的新宠

5i77ajz5u7ji6

311 0 0

-开发达人-

机器学习/深度学习存储人工智能

Attention机制竟有bug，Softmax是罪魁祸首，影响所有Transformer

-开发达人-

137 0 0

Attention机制竟有bug，Softmax是罪魁祸首，影响所有Transformer

羽林小王子

机器学习/深度学习语音技术 C++

self-attention - 李宏毅笔记

羽林小王子

95 0 0

5i77ajz5u7ji6

数据可视化计算机视觉

大道至简 | 设计 ViT 到底怎么配置Self-Attention才是最合理的？（二）

5i77ajz5u7ji6

144 0 0

遍地开花的 Attention ，你真的懂吗？

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

遍地开花的 Attention ，你真的懂吗？

热门文章

最新文章

相关电子书