开发者社区云计算文章正文

【Medical & Transformer】论文阅读（极简版），可忽略该篇（写给自己）

2023-02-20 172

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【Medical & Transformer】论文阅读（极简版），可忽略该篇（写给自己）

复现的代码没看到。

Records

正常在TransformerQ中，都是通过线性变化来得到qk v的。

下图中的1x1，是因为作者没有用全连接，用的是1x1的卷积，这样做也是可以的。

相对位置编码。倘若共有64号，在1号看来，有64个相对编码，2号看来也是有64个相对位置编码。

在—开始的时候，是通过随机初始化的方式，往后就是会更新的，相对位置编码是可学习的参数。

符号的意思是矩阵乘法。

aliyun4699881368-40398

楠竹11

5月前

机器学习/深度学习算法网络架构

神经网络架构殊途同归？ICML 2024论文：模型不同，但学习内容相同

【8月更文挑战第3天】《神经语言模型的缩放定律》由OpenAI研究人员完成并在ICML 2024发表。研究揭示了模型性能与大小、数据集及计算资源间的幂律关系，表明增大任一资源均可预测地提升性能。此外，论文指出模型宽度与深度对性能影响较小，较大模型在更多数据上训练能更好泛化，且能高效利用计算资源。研究提供了训练策略建议，对于神经语言模型优化意义重大，但也存在局限性，需进一步探索。论文链接：[https://arxiv.org/abs/2001.08361]。

楠竹11

65 1 1

楠竹11

7月前

数据采集人工智能算法

视觉语言模型导论：这篇论文能成为你进军VLM的第一步

【6月更文挑战第20天】探索AI如何理解与生成图像和文本，VLM结合图像与文本映射，涉及图像描述、问答等任务。论文由多所名校和机构研究人员共创，介绍VLM历史、类型（对比学习、掩码、生成、预训练）及应用，如图像生成和问答。同时，讨论数据质量、计算资源和模型可解释性的挑战。[阅读更多](https://arxiv.org/pdf/2405.17247)

楠竹11

255 2 2

度假的小鱼

8月前

机器学习/深度学习数据采集自然语言处理

【传知代码】BERT论文解读及情感分类实战-论文复现

本文介绍了BERT模型的架构和技术细节，包括双向编码器、预训练任务（掩码语言模型和下一句预测）以及模型微调。文章还提供了使用BERT在IMDB数据集上进行情感分类的实战，包括数据集处理、模型训练和评估，测试集准确率超过93%。BERT是基于Transformer的预训练模型，适用于多种NLP任务。在实践中，BERT模型加载预训练权重，对输入数据进行预处理，然后通过微调适应情感分类任务。

度假的小鱼

466 0 0

甜面酱肉丝

机器学习/深度学习 Shell 数据处理

深度学习原理篇第九章：UP-DETR

简要介绍UP-DETR的原理和代码实现。

甜面酱肉丝

264 0 0

羽林小王子

机器学习/深度学习自然语言处理机器人

Transformer - 李宏毅笔记

羽林小王子

301 0 0

-开发达人-

机器学习/深度学习人工智能自然语言处理

LeCun 70页长篇巨作！自监督学习「葵花宝典」，手把手教你学会

-开发达人-

232 0 0

-开发达人-

机器学习/深度学习人工智能自然语言处理

史上最全Transformer合集！LeCun力推：给60个模型建目录，哪篇论文你错过了？

-开发达人-

414 0 0

-开发达人-

机器学习/深度学习自然语言处理安全

-开发达人-

282 0 0

胡临任

机器学习/深度学习算法

一篇文章读懂人工神经网络

人工神经网络（ANN）是通过中神经元的信息处理机制开发的解决各种问题的数学模型。本文将通过讲解人工神经网络的原理、实现步骤、实际案例，带着大家读懂人工神经网络。

胡临任

537 1 2

技术小能手

机器学习/深度学习 UED

独家 | 一文读懂人工神经网络

技术小能手

4731 0 0

【Medical & Transformer】论文阅读（极简版），可忽略该篇（写给自己）

Records

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【Medical & Transformer】论文阅读（极简版），可忽略该篇（写给自己）

Records

热门文章

最新文章

相关课程

相关电子书

相关实验场景