Re34:读论文 Organizing Portuguese Legal Documents through Topic Discovery

简介: 本文是2022年SIGIR会议SIRIP(工业)track的paper,关注对法律文书的整理工作(整理、组织、摘要、发现隐主题),以巴西最高法院Jusbrasil的葡萄牙语数据集为例,进行主题建模,直接用术语表而非文档。本文主要探索各种主题建模方法在葡萄牙语数据集上的效果(我咋感觉这个工作量不高呢,是我的错觉吗还是事实如此,SIGIR不是顶会吗,就这?)。

1. 主题建模方法

CombinedTM(CTM)

Top2Vec

BERTopic


2. 数据集和指标

数据集是2K+无标签文档,和425条有标签文档。

这里面介绍了一堆硬指标软指标什么的,感觉还挺复杂的,以后做相关领域了再慢慢看。


3. 实验结果

image.png


目录
打赏
0
0
0
0
20
分享
相关文章
带你读《2022技术人的百宝黑皮书》——Short-Video Marketing in E-commerce: Analyzing and Predicting Consumer Response(1)
带你读《2022技术人的百宝黑皮书》——Short-Video Marketing in E-commerce: Analyzing and Predicting Consumer Response(1)
117 0
带你读《2022技术人的百宝黑皮书》——Short-Video Marketing in E-commerce: Analyzing and Predicting Consumer Response(11)
带你读《2022技术人的百宝黑皮书》——Short-Video Marketing in E-commerce: Analyzing and Predicting Consumer Response(11)
带你读《2022技术人的百宝黑皮书》——Short-Video Marketing in E-commerce: Analyzing and Predicting Consumer Response(14)
带你读《2022技术人的百宝黑皮书》——Short-Video Marketing in E-commerce: Analyzing and Predicting Consumer Response(14)
带你读《2022技术人的百宝黑皮书》——Short-Video Marketing in E-commerce: Analyzing and Predicting Consumer Response(15)
带你读《2022技术人的百宝黑皮书》——Short-Video Marketing in E-commerce: Analyzing and Predicting Consumer Response(15)
Re16:读论文 ILDC for CJPE: Indian Legal Documents Corpus for Court Judgment Prediction and Explanation
Re16:读论文 ILDC for CJPE: Indian Legal Documents Corpus for Court Judgment Prediction and Explanation
Re16:读论文 ILDC for CJPE: Indian Legal Documents Corpus for Court Judgment Prediction and Explanation
Re32:读论文 Summarizing Legal Regulatory Documents using Transformers
这篇文章提出了一个英文法律规范文件摘要数据集。模型就是很简单地把抽取式摘要建模成每一句的二分类任务,还测试了在此之前用TextRank先抽取一遍的效果。(这个指标甚至没有做人工的) 看起来非常简单,这样就能发SIGIR吗,那我怎么不行…… 所以可能本文的贡献重点在数据集上吧!
Re32:读论文 Summarizing Legal Regulatory Documents using Transformers
Re8:读论文 Hier-SPCNet: A Legal Statute Hierarchy-based Heterogeneous Network for Computing Legal Case
Re8:读论文 Hier-SPCNet: A Legal Statute Hierarchy-based Heterogeneous Network for Computing Legal Case
Re8:读论文 Hier-SPCNet: A Legal Statute Hierarchy-based Heterogeneous Network for Computing Legal Case