【论文写作分析】之二 《基于类别混合嵌入的电力文本层次化分类方法》

简介: 【论文写作分析】之二 《基于类别混合嵌入的电力文本层次化分类方法》

·阅读摘要:

 在本文中,提出了模型HONLSTM-BERT,我觉得亮点有二:一是提出把标签的类别嵌入、标签的语义嵌入、文本三者混合,二是提出的层级模型中共享了一部分参数,并不是每个层级就是一个独立的模型。

·参考文献:

 [1] 基于类别混合嵌入的电力文本层次化分类方法

【注一】:从论文贴出来的准确率(下图)来看,我觉得论文提出的模型相比于TextCNN、DPCNN这些baseline,还是吃了BERT的“红利”。

image.png

HONLSTM-BERT模型


  模型图如下所示:

image.png

  模型还是比较一目了然的。在多层级中,可以发现ON-LSTM层Max Pooling层的参数是共享的,即每层用的是同一个ON-LSTM层Max Pooling层

  嵌入层是用的BERT来编码的。

 wse(p)表示上一层预测出来的标签p的文本嵌入词向量,会与文本词向量进行拼接。

   pos(p)表示上一层预测出来的标签p的位置向量,是one-hot编码。

【注二】:写作技巧感觉还是,新领域+改模型。这篇论文的小trick是用改进的BERT模型与baseline作比较。

相关文章
|
算法 Java 存储
详解蚂蚁金服 SOFAJRaft | 生产级高性能 Java 实现
Scalable Open Financial Architecture Stack 是蚂蚁金服自主研发的金融级分布式架构,包含了构建金融级云原生架构所需的各个组件,是在金融场景里锤炼出来的最佳实践。
13753 0
|
关系型数据库 MySQL 程序员
让人敬佩的白发程序员——MySQL/MariaDB之父Monty阿里交流会
承蒙中国MySQL用户组(CMUG, China MySQL User Group)这次邀请了MySQL之父Monty进行一次中国行活动,作为CMUG的主席团成员和MariaDB基金会的Maria Captains(基金会的Committor),也利用“职务之便”顺手将Monty邀请到了阿里进行一次
15201 0
|
1天前
|
云安全 数据采集 人工智能
古茗联名引爆全网,阿里云三层防护助力对抗黑产
阿里云三层校验+风险识别,为古茗每一杯奶茶保驾护航!
古茗联名引爆全网,阿里云三层防护助力对抗黑产
|
5天前
|
Kubernetes 算法 Go
Kubeflow-Katib-架构学习指南
本指南带你深入 Kubeflow 核心组件 Katib,一个 Kubernetes 原生的自动化机器学习系统。从架构解析、代码结构到技能清单与学习路径,助你由浅入深掌握超参数调优与神经架构搜索,实现从使用到贡献的进阶之旅。
275 139
|
5天前
|
人工智能 中间件 API
AutoGen for .NET - 架构学习指南
《AutoGen for .NET 架构学习指南》系统解析微软多智能体框架,涵盖新旧双架构、核心设计、技术栈与实战路径,助你从入门到精通,构建分布式AI协同系统。
290 142
|
16天前
|
存储 关系型数据库 分布式数据库
PostgreSQL 18 发布,快来 PolarDB 尝鲜!
PostgreSQL 18 发布,PolarDB for PostgreSQL 全面兼容。新版本支持异步I/O、UUIDv7、虚拟生成列、逻辑复制增强及OAuth认证,显著提升性能与安全。PolarDB-PG 18 支持存算分离架构,融合海量弹性存储与极致计算性能,搭配丰富插件生态,为企业提供高效、稳定、灵活的云数据库解决方案,助力企业数字化转型如虎添翼!
|
11天前
|
缓存 并行计算 PyTorch
144_推理时延优化:Profiling与瓶颈分析 - 使用PyTorch Profiler诊断推理延迟,优化矩阵运算的独特瓶颈
在2025年的大模型时代,推理时延优化已经成为部署LLM服务的关键挑战之一。随着模型规模的不断扩大(从数亿参数到数千亿甚至万亿参数),即使在最先进的硬件上,推理延迟也常常成为用户体验和系统吞吐量的主要瓶颈。
356 147