【论文写作分析】之一 《基于混合注意力Seq2seq模型的选项多标签分类》

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 【论文写作分析】之一 《基于混合注意力Seq2seq模型的选项多标签分类》

[1] 参考论文信息


  论文名称:《基于混合注意力Seq2seq模型的选项多标签分类》

  发布期刊:《计算机工程与应用》

  期刊信息:CSCD扩展

image.png

  论文写作分析摘要:本文非常典型,把几个模型里的亮点抽出缝合在一起,然后放在一个从来没使用过的领域上跑。这种写法简直就是我的理想型。

[2] 参考论文分解


  这篇论文的支撑点有二:模型新领域

[2.1] 从模型来看

  先看一下论文给出的模型:

image.png

  模型使用到的点有:

  1、混合注意力机制+Seq2Seq模型(Hybrid Attention of Seq2seq Model)

  2、多头自注意力机制(Multi-Head self-Attention)

  3、标签嵌入(Label-Embedding)

  4、掩码模块(Masked Softmax)

  开始分析:

  本文模型是另外三篇论文的融合,分别是:

  1、《SGM: Sequence Generation Model for Multi-Label Classification》提出的模型和本文提出的模型不能说相差不大,只能说一模一样。本文是在SGM模型的基础上改动的。

   2、SGM是注意力机制,本文是混合注意力机制+多头自注意力机制,混合注意力机制来自《Semantic-Unit-Based Dilated Convolution for Multi-Label Text Classification》,多头自注意力机制来自《Attention is All You Need》。

  3、SGM是全局嵌入,本文是标签嵌入。

  除此之外,SGM来提出了用波束搜索算法找出预测路径,本文没有说。

【注】:

《SGM: Sequence Generation Model for Multi-Label Classification》博客地址:这里!!!

《Semantic-Unit-Based Dilated Convolution for Multi-Label Text Classification》博客地址:这里!!!

《Attention is All You Need》博客地址:这里!!!

  最后,看一下SGM模型图

image.png

[2.2] 从应用领域来看

  我们普通使用的是,新闻文本多标签分类、论文摘要文本多标签分类。

  开始分析:

  本文是对高考语文试卷的阅读理解的答案拿出来,每个选项当作一个文本,一共有5个标签:写作技巧类、思想情感类、词句理解类、分析综合类、因果推理类。

  脱去外壳它就是个普普通通的多标签文本分类,但是文中提到的名词有:选项多标签分类 。总得来说就是讲故事的能力要很不错。

[3] 总结


  如果实在写不出来论文,不妨试试缝合模型+找个新领域

相关文章
|
机器学习/深度学习 人工智能 自然语言处理
一文尽览 | 开放世界目标检测的近期工作及简析!(基于Captioning/CLIP/伪标签/Prompt)(上)
人类通过自然监督,即探索视觉世界和倾听他人描述情况,学会了毫不费力地识别和定位物体。我们人类对视觉模式的终身学习,并将其与口语词汇联系起来,从而形成了丰富的视觉和语义词汇,不仅可以用于检测物体,还可以用于其他任务,如描述物体和推理其属性和可见性。人类的这种学习模式为我们实现开放世界的目标检测提供了一个可以学习的角度。
一文尽览 | 开放世界目标检测的近期工作及简析!(基于Captioning/CLIP/伪标签/Prompt)(上)
|
2月前
|
机器学习/深度学习 JSON 算法
语义分割笔记(二):DeepLab V3对图像进行分割(自定义数据集从零到一进行训练、验证和测试)
本文介绍了DeepLab V3在语义分割中的应用,包括数据集准备、模型训练、测试和评估,提供了代码和资源链接。
328 0
语义分割笔记(二):DeepLab V3对图像进行分割(自定义数据集从零到一进行训练、验证和测试)
|
4月前
|
机器学习/深度学习
ChatGPT 等相关大模型问题之Transformer中将Attention值转换为概率如何解决
ChatGPT 等相关大模型问题之Transformer中将Attention值转换为概率如何解决
|
6月前
|
机器学习/深度学习 自然语言处理 TensorFlow
|
6月前
|
机器学习/深度学习 自然语言处理 算法
【CV大模型SAM(Segment-Anything)】真是太强大了,分割一切的SAM大模型使用方法:可通过不同的提示得到想要的分割目标
【CV大模型SAM(Segment-Anything)】真是太强大了,分割一切的SAM大模型使用方法:可通过不同的提示得到想要的分割目标
|
人工智能 计算机视觉
分割一切后,Segment Anything又能分辨类别了:Meta/UTAustin提出全新开放类分割模型
分割一切后,Segment Anything又能分辨类别了:Meta/UTAustin提出全新开放类分割模型
250 0
|
测试技术 PyTorch TensorFlow
Yolov5-6.2 正式发布 | Yolov5 也可以训练分类模型啦,语义分割+实例分割很快到来
Yolov5-6.2 正式发布 | Yolov5 也可以训练分类模型啦,语义分割+实例分割很快到来
583 0
|
机器学习/深度学习 人工智能 自然语言处理
Seq2Seq、SeqGAN、Transformer…你都掌握了吗?一文总结文本生成必备经典模型(2)
Seq2Seq、SeqGAN、Transformer…你都掌握了吗?一文总结文本生成必备经典模型
170 0
|
机器学习/深度学习 自然语言处理 PyTorch
Seq2Seq、SeqGAN、Transformer…你都掌握了吗?一文总结文本生成必备经典模型(1)
Seq2Seq、SeqGAN、Transformer…你都掌握了吗?一文总结文本生成必备经典模型
213 0
|
机器学习/深度学习 自然语言处理 PyTorch
【多标签文本分类】代码详解Seq2Seq模型
【多标签文本分类】代码详解Seq2Seq模型
327 0
【多标签文本分类】代码详解Seq2Seq模型

热门文章

最新文章