9.18 评价指标
LDL 的输出结果有别于 SLL 与 MLL,为一个标记分布,相应的其评价标准也应该与 SLL、MLL 不同。一个自然的选择是预测出的标记分布与真实标记分布之间的平均距离或相似度。由于标记分布与概率分布的相似性,可借鉴已有的衡量两种概率分布之间距离 / 相似度的指标[10] 。本文选取了 6 个具有代表性的评测指标,其中 4 个是距离指标, 包 括 Chebyshev 距 离、Clark 距 离、Canberra度量与 KL 散度;另外 2 个是相似度指标,包括cosine 系数与 intersection 相似度。假设真实的标记分布为 、预测的标记分布为,则上述评价指标具体计算公式如表1所示,其中↓表示越小越好、↑表示越大越好。