对话IBM Project Debater顶尖科学家,揭秘首个能与人类辩论的AI系统

简介:

4cc7572b419571cab6efbc5be482c51946027682

IBM海法研究院Project Debater 首席研究员Noam Slonim博士(左)、Project Debater 全球经理Ranit Aharonov博士(右)

还记得Project Debater吗?IBM今年推出的首个能与人类辩论的AI系统。

今年6月,Project Debater参加了在旧金山举行的与人类辩论高手PK的公开辩论赛。在没有提前获知辩题的情况下,Project Debater依靠强大的语料库,独自完成陈述观点、反驳辩词、总结陈述的整个辩论过程。智能进化论曾做过详细报道,《AI首次实现与人类辩论,IBM Project Debater真正想突破的是什么?》

9月7日,进化君视频采访了Project Debater团队的几位科学家,包括来自以色列IBM海法研究院的Project Debater首席研究员Noam Slonim博士、Project Debater团队经理Ranit Aharonov博士,以及IBM AI Tech副总裁Aya Soffer博士。

IBM为什么要研究会辩论的AI?Project Debater遇到的难题是什么?创新在哪里?下一步将如何发展?关于外界关注的这些问题,几位科学家用通俗易懂的表达做了详尽解释。

5ad0667d43697e1e717ac05dc22c61903da79dc5

IBM为什么要教机器辩论?

当Watson 2011年在《危险边缘》(Jeopardy!)益智问答中击败人类选手后,IBM的AI研究人员便开始寻找下一个具备重大挑战的研究领域。科学家们希望,新的方向既要与人类实际生活相关,在难度上又要超越AI此前能够解决的挑战。

虽然公开辩论不是一个常见的场景,但辩论的能力却是人们制定决策的关键,不管在日常生活还是工作中。被誉为批判性思维(Critical Thinking)圣经之作的《学会提问》一书中指出,无论总统还是普通人,都要面临一个问题,那就是当别人告诉你要做A,要做B,甚至A和B 是相反的意见时,我们需要运用批判性思维,在这些不同的意见中做出独立的明智的决策判断。

Aya Soffer博士介绍,“真实世界中,我们并不需要像《危险边缘》那样完成很多琐碎的知识问答,而是要回答真正重要的问题,并做出真正重要的决策。决策的重要性决定了我们确定要把辩论功能作为AI的下一个重大挑战去做相关研究。”

此外,辩论还是一个开放式的挑战,这与之前AI所解决的挑战都不同。此前,不论益智问答还是下围棋、玩电脑游戏,这些活动都有明确的衡量输赢的标准。辩论则像在真实世界中做商业决策一样,没有清晰的以绝对的分数高低衡量输赢的简单标准。

由此,Project Debater的应用主要集中在两个领域,第一是有研究、分析、收集信息需要的人士。如金融分析师、律师、记者、科学家等。他们需要就某一个主题寻找相关信息,并且以相关的方式去组织这些信息,了解其利与弊。

第二个是需要做决策的领域,比如企业董事会成员和高级管理人员。往往他们要做决策是自己尚未充分了解的内容,面临非常多的信息。Project Debater可以帮助他们迅速了解一个问题的正反两面,做出更好的基于证据、基于关键信息的决策。

Project Debater团队经理Ranit Aharonov博士表示,“由AI辅助去解决大多数不是非对即错、非赢即输的问题,将是AI将来发展的一个方向。”而辩论本身不是为了输赢,而是为了获得更多的决策角度。

“基于循证、基于证据的决策,这是非常大的待开发的AI领域,所以可以通过辩论去实现这一个领域的落地。”Aya Soffer博士强调。虽然有着广泛的应用场景,科学家们也表示,目前Project Debater还处在研究初级阶段,没有商业应用的计划。但是,Project Debater具备的自然语言理解相关的能力,会进入到Watson产品为更多企业服务。

ded20db0821693434ee0fa9af78ff71f0f004cec

IBM海法研究院Project Debater 首席研究员Noam Slonim博士(右)、Project Debater 全球经理Ranit Aharonov(左)接受视频采访

Debater是如何应对即兴、不可预测的辩论内容的?

在6月份旧金山的公开辩论赛中,Project Debater事先没有拿到任何辩题。和人类选手一样,拿到辩题后只有30分钟的准备时间。在这期间,Project Debater需要首先分析辩题,然后扫描拥有3 亿多个可靠信息来源的庞大语料库,通过算法找出与辩题相关性最高的观点性内容,同时减少重复信息,最终形成有说服力的论点和支撑论据。

这一过程中,Project Debater主要依靠三大能力:一,数据驱动的演讲稿撰写和表达,即从大量语料库中寻找素材并撰写结构良好的演讲内容;二、听力理解,能够识别长段连续口语中隐含的重要概念和观点,这与只需要听懂一句话的语音助手完全不同;三、模拟人类困境(dilema),针对性地提出有原则的论点。

在自由辩论环节,Project Debater很难预测对方会怎样说。那么,它是如何实时应对完全即兴的、不可预期的辩论内容,并做出针对性的反驳的?这可以说训练Project Debater辩论时最大的挑战。

Noam Slonim博士详细解释了Project Debater如何应对这一挑战:通过构建知识图谱,针对不同论证中的共同点建模,形成辩驳的能力。

“举个例子,比如说涉及到是否要禁止人体器官贸易,是否要禁止酒精贸易。人们可以自然而然地推断出,如果禁止相关交易,将导致黑市蓬勃发展的风险。模拟这一场景,可以为Project Debater建模,当遇到类似有关禁止类型的辩题时,Project Debater就可以依据模拟好的知识图谱,等待着与黑市相关话题的出现,然后去寻找与黑市相关的论证就可以了。”

但是事情没有这么简单。比如美国最近讨论比较多的热门话题,是否禁止在公共场合母乳喂养。同样是禁止相关内容,但跟黑市一点关系都没有。

“所以我们需要在这些方面不断去建模、扩大语料库,包括人类丰富的语言中各种细微和微妙的地方。这样Project Debater在已经建模的知识图谱中,才能够更加精准地为自己导航,找到支持自己论点的内容。”Noam Slonim博士强调。

Project Debater的学习模式

学会辩论的Project Debater是否会像Alpha Go那样能够自动学习,越来越聪明?

科学家们解释说,Project Debater并没有用到训练Alpha Go的强化学习工具。强化学习是机器学习中一个重要的类型,其典型特点就是在没有人为指导的情况下,通过不断的“试错”获得反馈来提升任务性能。但反馈需要明确的衡量标准,比如会导致游戏赢还是输。

但是Project Debater的辩论场景是开放式、不是非赢即输的,人们对于辩论陈述的好坏评价是非常主观的判断。进化君理解,Project Debater 的训练中使用了深度神经网络和弱监督学习。深度神经网络(DNN)和弱监督都要用到有标签的数据去培训机器做出正确的回答。

据介绍,除了人工标签,研究人员还教会Project Debater通过关键词判别标签,比如一旦句子中出现“认为”、“想”、“假定”、“相信”等表达,这就判定为属于陈述内容。科学家开发了多种工具和方法,以弱监督方式训练DNN,以获得训练需要的大量人工标记的高质量数据。

此外,Project Debater是否会向人类中的一级辩手中学习?

Ranit Aharonov博士表示,“在涉及到通过建模去模拟人类困境的时候我们听取顶级辩手的意见,参考他们是如何应对在同样一个话题下不同观点的冲突。”

f8a9da8a73bddc3383e6b1e970e987319e360b71

Project Debater的构成要素与潜在应用(来源:IBM海法研究院)

Project Debater的下一步,让人工智能更像人

作为项目的首席研究员,Noam Slonim博士加入IBM已经11年了,自2012年至今都专注于Project Debater的研究。虽然Debater团队成员已经在各种高质量科学会议上发表了30多篇作品,并开创了计算辩论(Computational Argumentation)这一全新领域,但Noam Slonim博士认为Project Debater处在早期的阶段,有长足发展空间。“有太多有趣的问题等着我们去发掘。就计算辩论本身而言就有太多有趣的问题。”

Noam Slonim博士认为,在亚里士多德提出的辩论三元素(logos逻辑、pathos情感、ethos可信)中,目前的AI研究还需要超越logos(逻辑)阶段。

Project Debater的最终目标也许并不是让机器像人一样自由辩论或者比人辩论得更好,而是促进AI在语言理解领域的研究。语言理解一直都AI领域的重点,也是IBM在AI研究方面关注的重点。科学家们认为,目前所有企业在这个方面的研究还远远不够。

“Project Debater下一步是怎么样的,就是要让人工智能更像人。我们希望AI下一步的发展是从比较窄的例子上学习,扩展到比较宽泛的领域、跨不同领域的应用,以及能够从概念上学习。不是仅仅是再学习的能力,而是自己去推理的能力。”Aya Soffer博士表示。


原文发布时间为:2018-09-25

本文作者:进化君

本文来自云栖社区合作伙伴“趣味科技v”,了解相关信息可以关注“趣味科技v”。

相关文章
|
26天前
|
人工智能 监控 安全
提效40%?揭秘AI驱动的支付方式“一键接入”系统
本项目构建AI驱动的研发提效系统,通过Qwen Coder与MCP工具链协同,实现跨境支付渠道接入的自动化闭环。采用多智能体协作模式,结合结构化Prompt、任务拆解、流程管控与安全约束,显著提升研发效率与交付质量,探索大模型在复杂业务场景下的高采纳率编码实践。
290 26
提效40%?揭秘AI驱动的支付方式“一键接入”系统
|
27天前
|
人工智能 自然语言处理 前端开发
最佳实践2:用通义灵码以自然语言交互实现 AI 高考志愿填报系统
本项目旨在通过自然语言交互,结合通义千问AI模型,构建一个智能高考志愿填报系统。利用Vue3与Python,实现信息采集、AI推荐、专业详情展示及数据存储功能,支持响应式设计与Supabase数据库集成,助力考生精准择校选专业。(239字)
139 12
|
23天前
|
存储 人工智能 搜索推荐
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
本文介绍基于LangGraph构建的双层记忆系统,通过短期与长期记忆协同,实现AI代理的持续学习。短期记忆管理会话内上下文,长期记忆跨会话存储用户偏好与决策,结合人机协作反馈循环,动态更新提示词,使代理具备个性化响应与行为进化能力。
249 10
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
|
20天前
|
机器学习/深度学习 人工智能 JSON
PHP从0到1实现 AI 智能体系统并且训练知识库资料
本文详解如何用PHP从0到1构建AI智能体,涵盖提示词设计、记忆管理、知识库集成与反馈优化四大核心训练维度,结合实战案例与系统架构,助你打造懂业务、会进化的专属AI助手。
140 6
|
26天前
|
人工智能 JSON 安全
Claude Code插件系统:重塑AI辅助编程的工作流
Anthropic为Claude Code推出插件系统与市场,支持斜杠命令、子代理、MCP服务器等功能模块,实现工作流自动化与团队协作标准化。开发者可封装常用工具或知识为插件,一键共享复用,构建个性化AI编程环境,推动AI助手从工具迈向生态化平台。
261 1
|
27天前
|
机器学习/深度学习 人工智能 自然语言处理
拔俗当AI成为你的“心灵哨兵”:多模态心理风险预警系统如何工作?
AI多模态心理预警系统通过融合表情、语调、文字、绘画等多维度数据,结合深度学习与多模态分析,实时评估心理状态。它像“心灵哨兵”,7×24小时动态监测情绪变化,发现抑郁、焦虑等风险及时预警,兼顾隐私保护,助力早期干预,用科技守护心理健康。(238字)
|
27天前
|
存储 人工智能 自然语言处理
拔俗AI产投公司档案管理系统:让数据资产 “活” 起来的智能助手
AI产投档案管理系统通过NLP、知识图谱与加密技术,实现档案智能分类、秒级检索与数据关联分析,破解传统人工管理效率低、数据孤岛难题,助力投资决策提效与数据资产化,推动AI产投数字化转型。
|
27天前
|
人工智能 算法 数据安全/隐私保护
拔俗AI多模态心理风险预警系统:用科技守护心理健康的第一道防线
AI多模态心理风险预警系统通过语音、文本、表情与行为数据,智能识别抑郁、焦虑等心理风险,实现早期干预。融合多源信息,提升准确率,广泛应用于校园、企业,助力心理健康服务从“被动响应”转向“主动预防”,为心灵筑起智能防线。(238字)
|
27天前
|
人工智能 搜索推荐 Cloud Native
拔俗AI助教系统:教师的"超级教学秘书",让每堂课都精准高效
备课到深夜、批改作业如山?阿里云原生AI助教系统,化身“超级教学秘书”,智能备课、实时学情分析、自动批改、精准辅导,为教师减负增效。让课堂从经验驱动转向数据驱动,每位学生都被看见,教育更有温度。
|
27天前
|
机器学习/深度学习 人工智能 监控
拔俗AI智能营运分析助手软件系统:企业决策的"数据军师",让经营从"拍脑袋"变"精准导航"
AI智能营运分析助手打破数据孤岛,实时整合ERP、CRM等系统数据,自动生成报表、智能预警与可视化决策建议,助力企业从“经验驱动”迈向“数据驱动”,提升决策效率,降低运营成本,精准把握市场先机。(238字)