IBM推出创新框架用“黑盒”方式,评估大模型的输出

简介: 【7月更文挑战第17天】IBM研发的创新框架以“黑盒”方法评估大模型输出的可信度,通过观察输入和输出,不涉及模型内部。采用逻辑回归模型,基于四个特征(输出长度、多样性、一致性和新颖性)来估计可信度。在多个数据集上测试,显示优于其他“黑盒”方法,且具有可解释性。但仅适用于可访问的模型,可能忽略内部细节,不适用于所有场景。[[arXiv:2406.04370](https://arxiv.org/abs/2406.04370)]

在人工智能领域,大语言模型(LLMs)的快速发展为我们带来了前所未有的计算能力。然而,随着模型的日益复杂化,我们也面临着一个重要的问题:如何评估模型的输出是否可信?为了解决这个问题,IBM的研究人员提出了一种创新的框架,通过“黑盒”方式来评估大模型的输出。

首先,让我们来了解一下这个框架的背景。在人工智能领域,模型的可信度是一个至关重要的问题。如果我们无法确定模型的输出是否可信,那么我们就无法完全信任模型的决策。因此,研究人员一直在努力寻找一种有效的方法来评估模型的可信度。

然而,对于大语言模型来说,这个问题变得更加复杂。由于这些模型的规模和复杂性,传统的评估方法可能不再适用。因此,IBM的研究人员转向了一种更简单的方法:通过“黑盒”方式来评估模型的输出。

那么,什么是“黑盒”方式呢?简单来说,就是通过观察模型的输入和输出,而不考虑模型内部的结构和参数。这种方式的优点是简单易行,不需要对模型有深入的了解。然而,它的缺点是可能无法捕捉到模型内部的一些重要信息。

为了解决这个问题,IBM的研究人员提出了一种创新的框架。他们通过设计一些新颖的特征,并使用这些特征来训练一个可解释的模型(如逻辑回归),从而来估计模型的输出可信度。

具体来说,他们使用了四个特征来估计模型的输出可信度:

1.模型的输出长度:一般来说,模型的输出越长,可能意味着模型对问题的理解越深入,因此输出的可信度也越高。
2.模型的输出多样性:如果模型的输出非常多样化,可能意味着模型对问题的理解还不够明确,因此输出的可信度较低。
3.模型的输出一致性:如果模型的输出与其他已知的正确答案一致,那么输出的可信度就较高。
4.模型的输出新颖性:如果模型的输出与已知的正确答案不同,但仍然合理,那么输出的可信度也较高。

通过使用这些特征,研究人员训练了一个逻辑回归模型来估计模型的输出可信度。他们使用了一些公开的基准数据集(如TriviaQA、SQuAD、CoQA和Natural Questions)来评估这个框架的效果。

结果显示,这个简单的框架在估计模型输出可信度方面非常有效。在大多数情况下,它都能够比其他现有的“黑盒”评估方法更好地区分可信和不可信的输出。在一些情况下,它的表现甚至比其他方法高出10%以上(以AUROC指标衡量)。

此外,这个框架还有一个重要的优势:它的可解释性。由于它使用了简单的逻辑回归模型,我们可以很容易地理解模型的决策过程,并找出哪些特征是最具有预测性的。

然而,这个框架也存在一些限制。首先,它只适用于那些可以通过“黑盒”方式访问的模型,而不能用于那些不公开的模型。其次,它可能无法捕捉到模型内部的一些重要信息,如参数的权重或激活函数的值。最后,它可能无法适用于所有类型的模型或任务。

论文地址:https://arxiv.org/abs/2406.04370

目录
相关文章
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
40年创新蝶变,IBM与中国共创新质生产力
40年创新蝶变,IBM与中国共创新质生产力
|
6月前
|
算法 数据可视化 数据挖掘
IBM SPSS Modeler分类决策树C5.0模型分析空气污染物数据
IBM SPSS Modeler分类决策树C5.0模型分析空气污染物数据
|
机器学习/深度学习 人工智能 安全
ICLR 2022 Spotlight | MSU联合MIT-IBM提出首个黑箱防御框架
ICLR 2022 Spotlight | MSU联合MIT-IBM提出首个黑箱防御框架
|
机器学习/深度学习 人工智能 自动驾驶
大模型如何可靠?IBM等学者最新《基础模型的基础鲁棒性》教程|NeurIPS 2022
大模型如何可靠?IBM等学者最新《基础模型的基础鲁棒性》教程|NeurIPS 2022
204 0
|
人工智能 计算机视觉 机器学习/深度学习
IBM发布最新AI模型,帮视障者“看”到更多
在IBM最新的论文中,研究人员提出了一种能自主制作多样化、创造性和符合人类语境的图片文字说明的模型。实验证明,图片的文字说明取得了“良好”的性能,未来可以为强大的新计算机视觉系统奠定了基础。
551 0
|
机器学习/深度学习 测试技术 算法框架/工具
【测评】GPU训练机器学习模型哪家强?AWS、谷歌云、IBM等6大平台对比
使用官方数据和Credit,初创公司Rare Technologies最近发布了一个超大规模机器学习基准,对比了AWS、谷歌云、IBM等6家GPU硬件平台,从配置到训练时间、精度、价格等各方面。AWS和谷歌虽然整合性能好,但是性价比还是LearderGPU这样的新公司占优。
6063 0
|
运维 安全 数据中心
IBM整合管理服务:云时代驱动IT服务创新
本文讲的是IBM整合管理服务:云时代驱动IT服务创新【IT168 专稿】日前,IBM全球信息科技服务部(GTS)在位于苏州工业园区的苏州国科数据中心举办IBM管理服务中心开业仪式。该整合管理服务中心坐落于苏州国科Tier-4级数据中心内,可为中国用户、及国外用户提供高级别数据中心整合管理服务。
1504 0
下一篇
无影云桌面