《中国人工智能学会通讯》——12.30 实验评估

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.30节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

12.30 实验评估

使用一个真实的数据集作为任务集合 , 称为China,它包含了中国的 200 个旅游风景点。在ChinaCrowds [1] 平台上进行实验。该平台是目前中国最大的众包平台,并且它具备相应的手机应用以支持相应基于位置的众包任务。采用 1 000 的预算( 每次任务分配的花费是 0.2 RMB),在每次任务分配过程中 , 安排给每个工人 h= 2 个。为验证提出的推断模型 (IM), 比较推断模型与其他两种常用的核心方法——多数投票法 (MV) 与标准期望最大化算法(EM) [2] 。为验证提出的最优分配算法(AccOpt),将之与随机方法 Random 和空间最优 (SF) [3] 方法比较。

图 3 展示了实验结果。结果表明 IM 比 EM 与MV 方法更为准确。这是由于 MV 不考虑工人质量对结果的影响 , 而 EM 仅考虑工人的平均质量。提出的推断模型由于考虑了工人的自身质量、距离相关质量以及兴趣点的影响力 , 因而取得了最好的推断效果。同时对于分配算法可以发现 AccOpt(Random) 取得了最好 ( 最差 ) 的准确率,AccOpt比 SF 和 Random 效果更好,是因为它每次都能够最大化整体地提升准确率。

image

相关文章
|
机器学习/深度学习 人工智能 搜索推荐
人工智能发音评估(Artificial Intelligence Pronunciation Scoring, AI-PS)
人工智能发音评估(Artificial Intelligence Pronunciation Scoring, AI-PS)
1276 2
|
机器学习/深度学习 人工智能 自然语言处理
人工智能领域中训练、评估和推理概念的了解
人工智能领域中训练、评估和推理概念的了解
1087 0
|
6月前
|
数据采集 人工智能 缓存
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
180 1
|
人工智能 安全 Anolis
中兴通讯分论坛邀您探讨 AI 时代下 OS 的安全能力 | 2024 龙蜥大会
操作系统如何提供符合场景要求的安全能力,构建更加安全可信的计算环境。
|
机器学习/深度学习 人工智能 算法
人工智能在金融反欺诈系统中的应用与评估
人工智能在金融反欺诈系统中的应用与评估
|
机器学习/深度学习 人工智能 PyTorch
人工智能平台PAI产品使用合集之只进行训练(train)而不进行评估(eval)该如何配置
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
机器学习/深度学习 人工智能 算法
AI日报:人工智能使用和评估的关键任务
AI日报:人工智能使用和评估的关键任务
|
机器学习/深度学习 人工智能 TensorFlow
人工智能实验 python tensorflow keras拟合正弦函数,工资预测,公司收益预测
人工智能实验 python tensorflow keras拟合正弦函数,工资预测,公司收益预测
210 0
|
数据采集 人工智能 算法
合工大-人工智能原理实验报告
合工大-人工智能原理实验报告
300 0
|
机器学习/深度学习 人工智能 自然语言处理
机器学习/人工智能 实验二:图像特征自动学习方法实践与分析
机器学习/人工智能 实验二:图像特征自动学习方法实践与分析
423 0
机器学习/人工智能 实验二:图像特征自动学习方法实践与分析

热门文章

最新文章