《中国人工智能学会通讯》——12.28 推断模型

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.28节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

12.28 推断模型

本章中给出一个推断模型,根据工人给任务的答案,它能够推断任务的关键词的真实结果。下面首先介绍模型的核心思想,然后给出模型构建与模型学习的一些细节。

建模核心思想 : 工人答案准确率的是建模的核心。 主要考虑如下因素对工人答案准确率的影响。

(1) 工人质量。它包含两个部分。① 工人自身质量。由于工人自身能力与背景知识的差别,每个工人有不同的自身质量。自身质量很低的工人,比如说一些恶意的工人或者对任务完全一无所知的工人,他们给出的答案往往是易错的。② 距离相关质量。工人对任务给出的答案质量还与任务与工人之间的距离有关联。直观上,工人由于对其附近的事物比较熟悉,因此对距离近的任务比距离远的任务往往能给出更准确的答案。不同的工人受距离的影响不同,部分工人仅对附近的一部分任务有比较好的了解;反之有些工人对距离不是特别敏感,即使距离较远,他们也能给出比较准确的答案。

(2) 任务兴趣点的影响力。同样需要考虑任务对应兴趣点的影响力对答案质量的影响。一方面,有些任务对应的兴趣点有一定的知名度,许多工人对这些兴趣点都有一定的背景知识,因此这些任务能比较容易获得准确的答案。在另一方面 , 有些兴趣点影响力较小,只有附近的工人对它们有了解。

模型细节: 根据上述,提出了一个概率图模型,如图 2 所示。在这个概率模型中,工人质量以及任务影响力都由随机变量参数来表示。该模型主要包括四个要素。image
(1) 真实结果。用一个二元随机变量 z t,k 来代表关键词 l t,k 的真实结果。 若 l t,k 是任务 t 的一个正确关键词 , 那么 z t,k =1;否则 z t,k =0。 z t,k 满足一个二元分布,即 P(z t,k =1) 表示 l t,k 是一个正确关键词的概率。推断模型最终通过计算P(z t,k )来推断l t,k 的真实结果,如果 P(z t,k =1) ≥ 0.5,则推断 l t,k 是一个正确关键词。

(2) 工人自身质量。 用一个随机变量 i w 来表示工人 w 的自身质量。i w 同样满足伯努利分布,即P(i w =1) 和 P(i w =0)=1-P(i w =1) 分别表示 w 是 l 一个具有高或者低自身质量工人的概率。

(3) 距离相关质量。设 d(w,t) 为工人 w 和任务 t 之间的规则化欧式空距离 (0 ≤ d(w,t) ≤ 1),d(w,t) 越小,那 w 给出一个正确答案的可能性就会越高。使用一种钟形函数来体现这种性质,即image, 其中 λ 是一个用于在 d(w,t)增长情况下控制函数值下降粒度的参数,λ 较大 , 则工人质量值下降较快。距离公式集合 F={f λ 1 , f λ 2 ,...,f λ |F| } 由一组固定的钟形函数构成 , 它们相关质量都逐渐降低 , 但降低的幅度并不相同。工人 w 对任务 t的距离相关质量是在距离公式集合上距离函数的一个线性组合 , 即 P(d w=fλ i )*f λ i (d(w,t))。其中 d w 是在距离公式集合上满足多元分布的一个随机变量。P(d w=fλ ) 可以认为是 f λ 在线性组合中的权重。由于不同的工人有不同的权重分布,d w 的分布反映了距离对质量的不同影响程度。

(4) 任务兴趣点影响力。相似地,基于距离公式集合给出任务兴趣点的影响力 (d t ),同样是一组距离函数的线性组合。

模型学习 : 结合以上描述,我们通过最大化模型中的观察值 r w,t,k 来估算参数。假定所有的答案(rw,t,k ) 是独立的,该方法最大化所有工人答案的可能性,即 argmax z t,k ,i w ,d w ,d t P(r w,t,k )。对应最大化可能性的 P(z t,k ) 就是模型推断的关键词是否正确的依据。 这里采用期望最大化算法来推导 P(z t,k ),推倒细节省略 , 具体见文献 [2]。

相关文章
|
9天前
|
机器学习/深度学习 人工智能 机器人
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
|
9天前
|
机器学习/深度学习 人工智能 图形学
如何将图形学先验知识融入到人工智能模型中?
如何将图形学先验知识融入到人工智能模型中?
|
5天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
21 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
5天前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
25 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
4月前
|
机器学习/深度学习 人工智能 数据处理
人工智能平台PAI操作报错合集之任务重启后出现模型拆分报错,该怎么办
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
21天前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
65 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与模型知识库在移动医疗产品中的落地应用
在现代医疗体系中,通义千问大模型与MaxKB知识库的结合,为医生和患者提供了前所未有的支持与便利。该系统通过实时问答、临床决策辅助、个性化学习和患者教育等功能,显著提升了诊疗效率和患者满意度。实际应用如乐问医学APP展示了其强大优势,但数据隐私和安全问题仍需关注。
25 0
|
2月前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
108 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
3月前
|
人工智能 安全 Anolis
中兴通讯分论坛邀您探讨 AI 时代下 OS 的安全能力 | 2024 龙蜥大会
操作系统如何提供符合场景要求的安全能力,构建更加安全可信的计算环境。
|
3月前
|
机器学习/深度学习 人工智能 算法
【人工智能】线性回归模型:数据结构、算法详解与人工智能应用,附代码实现
线性回归是一种预测性建模技术,它研究的是因变量(目标)和自变量(特征)之间的关系。这种关系可以表示为一个线性方程,其中因变量是自变量的线性组合。
71 2