【多标签文本分类】Large Scale Multi-label Text Classification with Semantic Word Vectors

简介: 【多标签文本分类】Large Scale Multi-label Text Classification with Semantic Word Vectors

·阅读摘要:

 本文提出了利用词向量+CNN/词向量+GRU来解决大规模数据下的多标签文本分类问题。

 [1] Large Scale Multi-label Text Classification with Semantic Word Vectors

[0] 摘要


  已有的多标签文本分类算法不考虑词序,选择使用词袋模型或TFIDF加权来创建文档向量。

  论文提出使用词嵌入和词序来提高多标签学习能力。使用卷积神经网络(CNN)和带有门控循环单元(GRU)的循环网络独立地用于预训练的word2vec嵌入,解决大规模的多标签文本分类问题。

【注一】:读到这里能发现论文发布地比较早。目前预训练的embedding已经很成熟了。

[1] 介绍


  语义词向量还没有被用于多标签文本分类领域。相反,多标签学习算法对模型文本使用单词袋表示或TF-IDF加权,它不考虑词序,会限制训练中使用的词汇量。

  为了克服这些缺点,论文提出在卷积神经网络(CNN)和带有门控循环单元(GRU)的循环神经网络模型中使用单词嵌入。

  CNN模型和GRU模型的性能都超过了流行的 二进制相关性方法

【注二】:二进制相关性方法在下面有介绍。

[2] 相关工作


[2.1] 多标签文本分类概述⭐

  解决多标签学习的算法可以大致分为三种:

  1、多标签分类;

  2、标签排序;

  3、多标签排序;

  多标签分类算法接受一个输入X,然后生成两部分的集合Y和¯Y,其中Y是相关标签的集合,而¯Y是Y的补码。

  标签排名并不决定一个分区,而是将标签从相关到不相关排序,索引越低表明相关性越高。

  多标签排序被看作是两者的结合,因为它产生标签的排序,以及一个双分区。也就是说,算法的目标是让Y中的标签比¯Y中的所有标签都要高。然后学习或手动设置阈值函数,以确定排序后的数组中有多少标签是相关的。

[2.2] 二进制关联(BR)方法

  该方法将多标签问题转化为一组多个二分类问题,其中每个问题对应一个特定的标签。

  该方法有下列缺点:

  1、首先,二元关联假设标签是独立的,这通常是一个错误的假设;

  2、由于丢弃标签相关性,BR常常无法预测不同的组合或标签,从而导致性能下降;

  3、数据集的不平衡也会对分类器产生更大的影响,因为负面例子的数量往往超过正面例子;

  4、BR可能会训练不必要数量的分类器。

[2.3] 前馈网络

  论文介绍了2种损失函数地计算方法:

  1、Zhang提出的

image.png

  2、Nam提出的使用标准的交叉熵误差函数代替Zhang提出的误差函数。

【注三】:交叉熵误差函数很重要,实现方法参考:https://blog.csdn.net/qq_43592352/article/details/122784389

[3] 卷积神经网络


  与Kim在2014年发布的TextCNN网络模型基本一致。

image.png

[4] 门控循环神经网络


  其实就是LSTM。

相关文章
|
小程序
小程序右上角的胶囊颜色怎么修改?
小程序右上角的胶囊颜色怎么修改?
433 0
|
监控 安全 Linux
CentOS7下部署ARL资产侦察灯塔系统
CentOS7下部署ARL资产侦察灯塔系统
1880 3
|
机器学习/深度学习 人工智能 算法
快瞳犬种识别效果图示,120种狗品种精准覆盖
犬种识别技术已从实验室走向大众,基于深度学习的卷积神经网络(CNN)和YOLO系列算法,可高效实现犬种分类与目标检测。本文介绍了快瞳犬种识别的技术原理、训练代码及应用场景,包括宠物管理、遗传疾病研究、公共安全、城市管理及遗失宠物寻找等。通过Python代码加载YOLOv8模型并进行训练,模型能在图像中标注犬种及其边界框,为智慧生活提供技术支持。
961 33
|
机器学习/深度学习 并行计算 数据可视化
目标分类笔记(二): 利用PaddleClas的框架来完成多标签分类任务(从数据准备到训练测试部署的完整流程)
这篇文章介绍了如何使用PaddleClas框架完成多标签分类任务,包括数据准备、环境搭建、模型训练、预测、评估等完整流程。
1375 0
目标分类笔记(二): 利用PaddleClas的框架来完成多标签分类任务(从数据准备到训练测试部署的完整流程)
|
机器学习/深度学习 存储 并行计算
深度学习之声纹识别
基于深度学习的声纹识别(Speaker Recognition)是一种通过分析和识别人的声音特征来确认身份的技术。
3256 2
|
JavaScript Java 测试技术
基于SpringBoot+Vue+uniapp的反诈科普平台的详细设计和实现
基于SpringBoot+Vue+uniapp的反诈科普平台的详细设计和实现
547 7
基于SpringBoot+Vue+uniapp的反诈科普平台的详细设计和实现
|
算法 PyTorch Go
深入解析yolov5,为什么算法都是基于yolov5做改进的?(一)
深入解析yolov5,为什么算法都是基于yolov5做改进的?(一)
|
人工智能 程序员 数据库
3分钟学会写文心一言指令
3分钟学会写文心一言指令
|
小程序 JavaScript Java
宿舍|学生宿舍管理小程序|基于微信小程序的学生宿舍管理系统设计与实现(源码+数据库+文档)
宿舍|学生宿舍管理小程序|基于微信小程序的学生宿舍管理系统设计与实现(源码+数据库+文档)
564 0