《中国人工智能学会通讯》——12.36 自适应任务分配技术

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.36节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

12.36 自适应任务分配技术

上节介绍的众包工人领域差异性对众包质量控制提出了两点新的要求,第一,能否估计众包工人在不同领域可能存在较大差异的准确率,并随着工人答题不断对估计进行更新;第二,能否根据估计的准确率,自适应地将任务分配给所属领域的“专家”,即准确率高的工人。为了达成这两点要求,本文提出自适应的任务分配技术 iCrowd。

图 3 给出了自适应任务分配 iCrowd 技术框架。该技术针对一组众包任务(Microtasks)进行分配,通过众包平台(Crowdsourcing Platform)利用众包进行求解。每当工人(Worker)请求任务时,iCrowd 对工人的类型进行如下判断。image

● 针对新工人(New Worker),iCrowd 通过Warm-Up 模块分配一些考试题(Q-Tasks),并通过工人的答案(QTask Answers)初步估计其准确率。

● 针 对 已 通 过 考 试 题 的 工 人(QualifiedWorker),自适应分配模块(Adaptive Assigner)对其进行任务分配:通过准确率估计模块(AccuracyEstimator)分析其已完成的历史任务,估计出工人在不同领域的准确率,进而通过任务分配模块(Microtask Assigner)将任务分配给准确率最高的工人进行解答。注意,以上估计 - 分配过程是不断进行的,随着工人答题数量的增加,准确率的估计会持续更新,任务分配也会根据更新的准确率自适应的修正。

框架中最核心的挑战在准确率估计(AccuracyEstimator)和任务分配(Microtask Assigner)模块,下面简介它们的思想,具体技术细节见文献 [34]。

准确率估计:核心的想法是把众包任务构建成图模型,结点表示任务,边表示任务之间的领域相似关系。例如,在判断篮球运动员国籍时,可以把每一任务建模成结点,如果两个任务比较相似,则在他们之间建一条边,并标注上相似性。其中相似性可以基于文本相似性,或是实体关系在知识库中的结构进行定义。基于上述图模型,准确率估计首先计算某一工人在已回答问题上的准确率,进而基于此估计其在未回答问题上的准确率。例如,某工人在补全篮球运动员的任务上表现出色,而在补全政治家的任务上很差,估计技术就给与前者相似的任务较大准确率,与后者相似的任务较小准确率。为了实现这一想法,在技术上,iCrowd 将估计问题形式化为综合考虑局部相似性和全局相似性的优化问题,并给出了高效策略进行优化求解与更新。

自适应任务分配:核心的想法是将某一任务分配给能完成它的准确率最高的 k 个工人。在此前提下,还需要考虑尽快将任务完成,从而进一步触发准确率估计模块更新工人的准确率。iCrowd 将自适应任务分配进行了形式化,证明找到最优分配方案是一个 NP 难问题,并提供了一个有效的方法进行近似求解。此外,iCrowd 也提出了考试题挑选方法,其基本想法是挑选那些“影响力”最大的任务作为考试题,使工人回答了这些任务后,iCrowd 可以在最大范围内估计他在其它题目可能的准确率。

相关文章
|
27天前
|
人工智能 JSON 前端开发
Agentic AI崛起:九大核心技术定义未来人机交互模式​
本文系统梳理AI智能体架构设计的九大核心技术,涵盖智能体基础、多智能体协作、知识增强、模型优化、工具调用、协议标准化及人机交互等关键领域,助力构建高效、智能、协同的AI应用体系。建议点赞收藏,持续关注AI架构前沿技术。
378 1
|
21天前
|
存储 机器学习/深度学习 人工智能
​​解锁AI检索的7大Embedding技术:从稀疏到多向量,一文掌握!​
本文系统解析七种主流文本嵌入技术,包括 Sparse、Dense、Quantized、Binary、Matryoshka 和 Multi-Vector 方法,结合适用场景提供实用选型建议,助你高效构建文本检索系统。
149 0
|
27天前
|
数据采集 Web App开发 人工智能
如何让AI“看懂”网页?拆解 Browser-Use 的三大核心技术模块
Browser-Use 是一种基于大语言模型(LLM)的浏览器自动化技术,通过融合视觉理解、DOM解析和动作预测等模块,实现对复杂网页任务的自主操作。它突破了传统固定选择器和流程编排的限制,具备任务规划与语义理解能力,可完成注册、比价、填报等多步骤操作。其核心功能包括视觉与HTML融合解析、多标签管理、元素追踪、自定义动作、自纠错机制,并支持任意LLM模型。Browser-Use标志着浏览器自动化从“规则驱动”向“认知驱动”的跃迁,大幅降低维护成本,提升复杂任务的处理效率与适应性。
718 28
|
11天前
|
机器学习/深度学习 人工智能 数据安全/隐私保护
阿里云 Qwen3 全栈 AI 模型:技术解析、开发者实操指南与 100 万企业落地案例
阿里云发布Qwen3全栈AI体系,推出Qwen3-Max、Qwen3-Next等七大模型,性能全球领先,开源生态超6亿次下载。支持百万级上下文、多模态理解,训练成本降90%,助力企业高效落地AI。覆盖制造、金融、创作等场景,提供无代码与代码级开发工具,共建超级AI云生态。
195 6
|
26天前
|
人工智能 安全 数据库
AI编程:普通人难以逾越的技术高墙-优雅草卓伊凡
AI编程:普通人难以逾越的技术高墙-优雅草卓伊凡
140 15
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术深度解析:生成式AI的革命性突破与产业应用实战
蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。
|
21天前
|
机器学习/深度学习 人工智能 资源调度
嵌入式AI领域关键技术的理论基础
本内容系统讲解嵌入式AI领域关键技术的数学理论基础,涵盖神经网络量化、剪枝、知识蒸馏与架构搜索的核心原理。深入探讨量化中的信息论与优化方法、稀疏网络的数学建模、蒸馏中的信息传递机制,以及神经架构搜索的优化框架,为在资源受限环境下实现高效AI推理提供理论支撑。
61 5
|
人工智能 安全 API
AI战略丨MCP 生态发展:从技术标准到商业机遇的全景解析
在 AI 时代,成功不再仅仅取决于技术的先进性,更取决于生态的构建能力和标准的制定权。
|
1月前
|
人工智能 自然语言处理 机器人
AI电话客服的服务质量提升路径:关键技术与典型应用场景解析
AI电话客服正从基础语音工具进化为能处理复杂业务的智能体。本文深入解析服务质量提升的关键技术路径与行业应用,涵盖语音识别、情感分析、多轮对话等核心技术,以及智能外呼、自动质检、客户数据分析等典型场景,助力零售、电商、制造、互联网等行业构建高效、有温度的智能客服体系,推动人机协同服务升级。
111 1

热门文章

最新文章