《中国人工智能学会通讯》——12.39 众包机器协同技术介绍

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.39节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

12.39 众包机器协同技术介绍

众包机器协同技术的核心想法是众包任务选择,即在一定预算约束下,选择最有“收益”的任务分配给众包工人进行求解。具体来讲,由于存在大量的 HTML 表格,而金钱上的预算又是有限的,假设为 k,能否精心挑选最有“收益”的 k 个表格中的列,让众包将它链接到知识库的概念上。剩余的列可以通过机器的方法,如基于文本相似性或图结构相似性进行匹配,或基于众包答案进行推理。

不难看出,众包机器协同技术的核心挑战在于如何定义“收益”,以及如何选出最有收益的 k 个HTML 表格的列。这里给出解决这些问题的基本想法,具体的技术介绍见文献 [33]。具体而言,有关表格列的收益考虑两方面因素:

● 任务的难度:如果一个任务对于机器来讲比较难,则应优先分配给众包解答。这里的“难度”反映了单纯依赖机器匹配的歧义程度。以图 6 为例,上面的一列机器以较大概率(0.95)认为是电影,而下面的一列机器则比较含糊,歧义性强。直观上讲,下面的列对于机器的难度更大。基于这一想法,提出了使用信息熵度量难度的方法。image

● 任务的推理能力:很多时候,如果众包解决了某些任务,可以帮助推断其他任务的答案。图 7给出了两种推理示意:① 左侧是表内推理。如果众包确定了表格的第二列是电影导演,那第一列是电影名称的可能性就提升了。② 右侧是表间推理。如果众包判断了一列的类型,与它相似的列对应到同一类型的可能性就提升了。基于这一想法,提出了基于概率的任务推理模型。image
基于上述因素,提出了任务收益(Utility)模型,并证明了挑选整体收益最大的 k 个任务这一问题属于 NP 难问题。为此,提出了一种有效的近似算法,并证明了该算法的近似比是 1 - 1/e(其中 e 为自然对数)。当众包返回 k 个任务的答案后,再根据前面介绍的表内和表间推理其它任务的答案。

相关文章
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
AI检测技术:如何识别机器生成的“数字指纹”?
AI检测技术:如何识别机器生成的“数字指纹”?
345 115
|
4月前
|
人工智能 自然语言处理 数据安全/隐私保护
AI生成的文本:如何识破机器的“笔迹”?
AI生成的文本:如何识破机器的“笔迹”?
808 85
|
4月前
|
人工智能 数据安全/隐私保护
AI生成的痕迹:我们如何检测机器撰写的文本
AI生成的痕迹:我们如何检测机器撰写的文本
1355 117
|
5月前
|
人工智能 数据挖掘 大数据
人工智能模型决策过程:机器与人类协作成效
决策智能(DI)融合AI与人类判断,提升商业决策质量。通过数据驱动的预测与建议,结合人机协作,实现更高效、精准的业务成果,推动企业迈向数据文化新阶段。(238字)
|
4月前
|
人工智能 生物认证 数据安全/隐私保护
AI检测器:我们如何识别机器生成的内容?
AI检测器:我们如何识别机器生成的内容?
393 3
|
4月前
|
机器学习/深度学习 人工智能
破译AI指纹:如何检测内容是否出自机器之手?
破译AI指纹:如何检测内容是否出自机器之手?
232 3
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能技术的探讨
人工智能的概念,人工智能的发展,人工智能的各种学派,人工智能的应用领域
413 4
|
5月前
|
人工智能 运维 监控
AI加持下的容器运维:别再当“背锅侠”,让机器帮你干活!
AI加持下的容器运维:别再当“背锅侠”,让机器帮你干活!
276 8
|
4月前
|
人工智能 搜索推荐 数据安全/隐私保护
AI检测技术:如何识别机器生成内容?
AI检测技术:如何识别机器生成内容?
344 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
拔俗AI语义大模型软件:让机器真正“懂”你的话
AI语义大模型远非聊天机器人,其核心由三大技术构成:基于Transformer的自注意力机制实现语言理解;通过预训练+微调,从通才成长为专才;结合提示工程与推理优化,提升输出质量与运行效率。这是一套深度融合算法、数据与工程的复杂系统,推动智能应用真正落地。
219 0

热门文章

最新文章