《中国人工智能学会通讯》——第1章 从图灵测试到智能信息获取 1.1 图灵测试与问答

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第1章,第1.1节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

第1章 从图灵测试到智能信息获取

随着计算机科学与互联网技术及产业的蓬勃发展,大数据相关的信息智能处理给人类的生活带来了天翻地覆的变化。在这个洪流中,人工智能技术的发展和贡献有目共睹,也同时得到了各大 IT 企业的强烈关注。其中,智能问答越来越受到关注,甚至于被预见为下一代互联网信息服务的基本形式。本文试图从图灵测试开始,探讨理解问答形式本身的性质、发展和未来。

1.1 图灵测试与问答

图灵(Turing),伟大的计算机科学家,1950 年发表了题为《计算机器与智能》的论文,提出了著名的“图灵测试(Turing Test)” [1] (见图 1)。所谓图灵测试,就是测试人与被测试者在相互隔离的情况下,对被测试者进行自然语言的提问,如果被测试者能够在 5 分钟的问答后,以超过 30% 的可能性让一位普通的测试者误以为其是人类,则说明机器通过了测试,并被认为具有人类的智能。
image
图灵测试最初作为测试计算机系统智能的标准、衡量真理的试金石而诞生,虽然饱受争议,但同时也是智能系统不断进步、不断完善的目标与动力。半个世纪以来伴随着人工智能的发展潮起潮落,每当人工智能的研究取得了重要突破时,图灵测试就会被提出来小试牛刀[2] ;而当人工智能的研究处于暂时的停滞时,图灵测试就会落满灰尘、束之高阁。

我们试图从不同的角度理解机器智能与图灵测试的辩证关系。其一,机器智能和图灵测试是统一的。一般认为,图灵测试是被作为机器智能的充分条件,通过了图灵测试,说明机器有足够的能力骗过人类,而不需要去关心底机器是用什么样的机理与方法。这和人工智能学派中“弱人工智能假设”目标一致:即实现一个机器,使得它可以表现出不低于人类的智能行为表现。例如,我们只需要造出可以飞的飞机,而不必让飞机和鸟儿一样的用扇动翅膀的方式飞翔。其二,机器智能和图灵测试也有不一致的一面。机器所表现出来的智能行为,很多情况下不在图灵测试的范畴中。例如,深蓝已经可以战胜国际象棋大师,或者通过大数据关联计算可以找到超市啤酒与尿布的销售关系,这些机器能够实现的智能行为,并不是普通人类所必备的,自然也不会用类似问题进行图灵测试。

多年来图灵测试被认为难以实现的原因在于它测试的是人类的认知智能,而不是感知智能或智能行为。在进行图灵测试时,提问的目的不在于得到某种实际的收益,而是要千方百计辨别被测试者是否具有人类的特征,包括知识、推理、规则和学习能力,甚至主观的非智能行为特征,包括情感、情绪等。所以,人工智能的研究者,既热衷于尝试图灵测试,从而体现当前智能研究水平,同时又冷漠甚至疏远图灵测试,畏惧于它的难度。一个有点令人沮丧的例子,现在大家纷纷吐槽的 12306 购票网站验证码,就可以看作一个简化版的测试:在精心挑选的问题集中,机器的智能表现与人类智能表现差异越大,验证码的设计就越成功。 假设我们设计不出用来区分人和机器的验证码,那么机器在一定意义上就通过了图灵测试,而其智能水平就真的高到了可怕。

当前智能研究水平,同时又冷漠甚至疏远图灵测试,畏惧于它的难度。一个有点令人沮丧的例子,现在大家纷纷吐槽的 12306 购票网站验证码,就可以看作一个简化版的测试:在精心挑选的问题集中,机器的智能表现与人类智能表现差异越大,验证码的设计就越成功。 假设我们设计不出用来区分人和机器的验证码,那么机器在一定意义上就通过了图灵测试,而其智能水平就真的高到了可怕。

图灵测试通常是作为人工智能的象征或者图腾存在的。它就在那里,我们要不断去接近它。而问答系统和图灵测试有什么关系呢?一方面,图灵测试的场景本身就是问答。如果我们有了和人一样智能的问答系统,那么就相当于通过了图灵测试。因此问答相关研究始终受到人工智能学者的重视。从知识工程、推理机、专家系统,到搜索引擎,智能助手甚至机器人,问答系统贯穿了人工智能的整个发展历程。另一方面,问答作为人类最自然的交互方式,有非常广泛的应用需求。问答系统所体现的智能行为,不是为了通过图灵测试而存在的,而是为了更加有效地解决现实中的任务。简而言之我们不能离开图灵测试背后的人类智能去研究问答系统,也不应该局限在图灵测试的角度去考量问答系统。

相关文章
|
8月前
|
人工智能 自然语言处理 JavaScript
利用MCP Server革新软件测试:更智能、更高效的自动化
MCP Server革新软件测试:通过标准化协议让AI实时感知页面结构,实现自然语言驱动、自适应维护的自动化测试,大幅提升效率,降低脚本开发与维护成本,推动测试左移与持续测试落地。
|
8月前
|
安全 数据管理 测试技术
告别蛮力:让测试数据生成变得智能而高效
告别蛮力:让测试数据生成变得智能而高效
656 120
|
9月前
|
人工智能 测试技术 调度
写用例写到怀疑人生?AI 智能测试平台帮你一键生成!
霍格沃兹测试开发学社推出AI智能测试用例生成功能,结合需求文档一键生成高质量测试用例,大幅提升效率,减少重复劳动。支持自定义提示词、多文档分析与批量管理,助力测试人员高效完成测试设计,释放更多时间投入核心分析工作。平台已开放内测,欢迎体验!
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能:有多少人工,才能有多少智能?
当下AI大模型的能力,特别是Agent领域,到底离不开多少“人工”的加持?本文将结合我的实际经验,深入探讨高质量数据与有效评价体系在Agent发展中的决定性作用,并通过编码Agent、Web Agent和GUI Agent的成熟度分析,揭示AI智能体发展面临的挑战与机遇。
406 89
|
9月前
|
机器学习/深度学习 人工智能 供应链
决策智能是新的人工智能平台吗?
决策智能融合数据、决策与行动,通过AI与自动化技术提升企业决策质量与效率,支持从辅助到自动化的多级决策模式,推动业务敏捷性与价值转化。
|
9月前
|
人工智能 自然语言处理 测试技术
AI测试平台的用例管理实践:写得清晰,管得高效,执行更智能
在测试过程中,用例分散、步骤模糊、回归测试效率低等问题常困扰团队。霍格沃兹测试开发学社推出的AI测试平台,打通“用例编写—集中管理—智能执行”全流程,提升测试效率与覆盖率。平台支持标准化用例编写、统一管理操作及智能执行,助力测试团队高效协作,释放更多精力优化测试策略。目前平台已开放内测,欢迎试用体验!
|
11月前
|
JavaScript 前端开发 测试技术
Playwright自动化测试系列课(4) | 异步加载克星:自动等待 vs 智能等待策略深度解析​
本文深度解析Playwright自动化测试中的等待策略,对比自动等待(零配置防御机制)与智能等待(精准控制异步场景)的核心差异。通过实战案例讲解等待机制的选择标准、常见失效原因及调试技巧,帮助开发者有效解决页面异步加载问题,提升测试脚本的稳定性和执行效率。
|
12月前
|
机器学习/深度学习 人工智能 自动驾驶
人机融合智能 | 以人为中心的人工智能伦理体系
本章探讨“以人为中心”的人工智能伦理体系,分析人工智能伦理与传统伦理学的关系、主要分支内容及核心原则。随着人工智能技术快速发展,其在推动社会进步的同时也引发了隐私、公平、责任等伦理问题。文章指出,人工智能伦理需融入传统伦理框架,并构建适应智能技术发展的新型伦理规范体系,以确保技术发展符合人类价值观和利益。
539 4
|
11月前
|
人工智能 物联网 测试技术
智能化测试基础架构:软件质量保障的新纪元
本文介绍了智能化测试基础架构的核心构成与优势。该架构融合AI、领域工程与自动化技术,包含智能测试平台、测试智能体、赋能引擎和自动化工具链四部分,能自动生成用例、调度执行、分析结果,显著提升测试效率与覆盖率。其核心优势在于实现专家经验规模化、质量前移和快速适应业务变化,助力企业构建新一代质量保障体系。建议从构建知识图谱和试点关键领域智能体起步,逐步推进测试智能化转型。
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
人机融合智能 | 数据与知识双驱动式人工智能
本章系统介绍了数据驱动、知识驱动及双驱动人工智能的理论与应用。数据驱动方法依赖大数据和深度学习,在图像识别、自然语言处理等领域取得突破,但面临标注成本高、可解释性差等问题。知识驱动方法通过知识表示与推理提升系统理解能力,却在泛化性和适应性上受限。为弥补单一范式的不足,数据与知识双驱动融合两者优势,致力于构建更智能、可解释且安全可靠的AI系统,兼顾伦理与隐私保护。文章还回顾了AI发展历程,从早期神经网络到当前大规模语言模型(如GPT、BERT)的技术演进,深入解析了各类机器学习与深度学习模型的核心原理与应用场景,展望未来AI发展的潜力与挑战。
750 0

热门文章

最新文章