IBM推出创新框架用“黑盒”方式，评估大模型的输出-阿里云开发者社区

IBM推出创新框架用“黑盒”方式，评估大模型的输出

2024-07-18 58

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【7月更文挑战第17天】IBM研发的创新框架以“黑盒”方法评估大模型输出的可信度，通过观察输入和输出，不涉及模型内部。采用逻辑回归模型，基于四个特征（输出长度、多样性、一致性和新颖性）来估计可信度。在多个数据集上测试，显示优于其他“黑盒”方法，且具有可解释性。但仅适用于可访问的模型，可能忽略内部细节，不适用于所有场景。[[arXiv:2406.04370](https://arxiv.org/abs/2406.04370)]

在人工智能领域，大语言模型（LLMs）的快速发展为我们带来了前所未有的计算能力。然而，随着模型的日益复杂化，我们也面临着一个重要的问题：如何评估模型的输出是否可信？为了解决这个问题，IBM的研究人员提出了一种创新的框架，通过“黑盒”方式来评估大模型的输出。

首先，让我们来了解一下这个框架的背景。在人工智能领域，模型的可信度是一个至关重要的问题。如果我们无法确定模型的输出是否可信，那么我们就无法完全信任模型的决策。因此，研究人员一直在努力寻找一种有效的方法来评估模型的可信度。

然而，对于大语言模型来说，这个问题变得更加复杂。由于这些模型的规模和复杂性，传统的评估方法可能不再适用。因此，IBM的研究人员转向了一种更简单的方法：通过“黑盒”方式来评估模型的输出。

那么，什么是“黑盒”方式呢？简单来说，就是通过观察模型的输入和输出，而不考虑模型内部的结构和参数。这种方式的优点是简单易行，不需要对模型有深入的了解。然而，它的缺点是可能无法捕捉到模型内部的一些重要信息。

为了解决这个问题，IBM的研究人员提出了一种创新的框架。他们通过设计一些新颖的特征，并使用这些特征来训练一个可解释的模型（如逻辑回归），从而来估计模型的输出可信度。

具体来说，他们使用了四个特征来估计模型的输出可信度：

1.模型的输出长度：一般来说，模型的输出越长，可能意味着模型对问题的理解越深入，因此输出的可信度也越高。
2.模型的输出多样性：如果模型的输出非常多样化，可能意味着模型对问题的理解还不够明确，因此输出的可信度较低。
3.模型的输出一致性：如果模型的输出与其他已知的正确答案一致，那么输出的可信度就较高。
4.模型的输出新颖性：如果模型的输出与已知的正确答案不同，但仍然合理，那么输出的可信度也较高。

通过使用这些特征，研究人员训练了一个逻辑回归模型来估计模型的输出可信度。他们使用了一些公开的基准数据集（如TriviaQA、SQuAD、CoQA和Natural Questions）来评估这个框架的效果。

结果显示，这个简单的框架在估计模型输出可信度方面非常有效。在大多数情况下，它都能够比其他现有的“黑盒”评估方法更好地区分可信和不可信的输出。在一些情况下，它的表现甚至比其他方法高出10%以上（以AUROC指标衡量）。

此外，这个框架还有一个重要的优势：它的可解释性。由于它使用了简单的逻辑回归模型，我们可以很容易地理解模型的决策过程，并找出哪些特征是最具有预测性的。

然而，这个框架也存在一些限制。首先，它只适用于那些可以通过“黑盒”方式访问的模型，而不能用于那些不公开的模型。其次，它可能无法捕捉到模型内部的一些重要信息，如参数的权重或激活函数的值。最后，它可能无法适用于所有类型的模型或任务。

论文地址：https://arxiv.org/abs/2406.04370

IBM推出创新框架用“黑盒”方式，评估大模型的输出

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

IBM推出创新框架用“黑盒”方式，评估大模型的输出

热门文章

最新文章

相关课程

相关电子书

相关实验场景