1. Background
likelihood of confusion:新商标与旧已有商标太像,会引起混淆,所以不允许。
低资源:深度学习模型会对小样本标注数据表现好(我觉得怪怪的……):(1) 迁移学习+finetune(对超参敏感)(2) 弱监督或远程监督
可解释性
2. 数据集
(说要公布但是还没有公布)由两部分组成:
- 525个样本:有从5个角度来衡量相似性的中间标签。分成训练集/验证集/测试集。
- 2852个样本:全都作为训练集。
- augment:
我没有搞懂这个augment数据集的标签数据是怎么得来的,意思是跟clean数据中相似的句子有一样的中间标签?然后最后标签就直接求最大值?阈值是什么?我看跟人工筛选的规则也不一样啊,没有各feature之间的关联?
3. 模型
3.1 主模型
3.2 curriculum learning
实现中间标签生成时使用的curriculum learning:
3.3 不做多任务范式的原因
(实验部分也拿多任务作为baseline了)
4. 实验
4.1 baseline:RoBERTa
- End-to-End
- 多任务
4.2 实验设置
4.3 主实验结果
中间标签的预测结果:
4.4 Calibration(这一部分还没看懂)
Expected Calibration Error (ECE)
5. 文献阅读思考
不管怎么想我还是觉得这个任务应该用多模态范式来做,比如对比图片和发音。(我看到Analytics and EU Courts: The Case of Trademark Disputes这一篇真的用了CV,我心满离)
6. 代码复现
这数据集都没放出来,代码也没放出来,我issue提了也不回,无法复现。