对话IBM Project Debater顶尖科学家,揭秘首个能与人类辩论的AI系统

简介:

4cc7572b419571cab6efbc5be482c51946027682

IBM海法研究院Project Debater 首席研究员Noam Slonim博士(左)、Project Debater 全球经理Ranit Aharonov博士(右)

还记得Project Debater吗?IBM今年推出的首个能与人类辩论的AI系统。

今年6月,Project Debater参加了在旧金山举行的与人类辩论高手PK的公开辩论赛。在没有提前获知辩题的情况下,Project Debater依靠强大的语料库,独自完成陈述观点、反驳辩词、总结陈述的整个辩论过程。智能进化论曾做过详细报道,《AI首次实现与人类辩论,IBM Project Debater真正想突破的是什么?》

9月7日,进化君视频采访了Project Debater团队的几位科学家,包括来自以色列IBM海法研究院的Project Debater首席研究员Noam Slonim博士、Project Debater团队经理Ranit Aharonov博士,以及IBM AI Tech副总裁Aya Soffer博士。

IBM为什么要研究会辩论的AI?Project Debater遇到的难题是什么?创新在哪里?下一步将如何发展?关于外界关注的这些问题,几位科学家用通俗易懂的表达做了详尽解释。

5ad0667d43697e1e717ac05dc22c61903da79dc5

IBM为什么要教机器辩论?

当Watson 2011年在《危险边缘》(Jeopardy!)益智问答中击败人类选手后,IBM的AI研究人员便开始寻找下一个具备重大挑战的研究领域。科学家们希望,新的方向既要与人类实际生活相关,在难度上又要超越AI此前能够解决的挑战。

虽然公开辩论不是一个常见的场景,但辩论的能力却是人们制定决策的关键,不管在日常生活还是工作中。被誉为批判性思维(Critical Thinking)圣经之作的《学会提问》一书中指出,无论总统还是普通人,都要面临一个问题,那就是当别人告诉你要做A,要做B,甚至A和B 是相反的意见时,我们需要运用批判性思维,在这些不同的意见中做出独立的明智的决策判断。

Aya Soffer博士介绍,“真实世界中,我们并不需要像《危险边缘》那样完成很多琐碎的知识问答,而是要回答真正重要的问题,并做出真正重要的决策。决策的重要性决定了我们确定要把辩论功能作为AI的下一个重大挑战去做相关研究。”

此外,辩论还是一个开放式的挑战,这与之前AI所解决的挑战都不同。此前,不论益智问答还是下围棋、玩电脑游戏,这些活动都有明确的衡量输赢的标准。辩论则像在真实世界中做商业决策一样,没有清晰的以绝对的分数高低衡量输赢的简单标准。

由此,Project Debater的应用主要集中在两个领域,第一是有研究、分析、收集信息需要的人士。如金融分析师、律师、记者、科学家等。他们需要就某一个主题寻找相关信息,并且以相关的方式去组织这些信息,了解其利与弊。

第二个是需要做决策的领域,比如企业董事会成员和高级管理人员。往往他们要做决策是自己尚未充分了解的内容,面临非常多的信息。Project Debater可以帮助他们迅速了解一个问题的正反两面,做出更好的基于证据、基于关键信息的决策。

Project Debater团队经理Ranit Aharonov博士表示,“由AI辅助去解决大多数不是非对即错、非赢即输的问题,将是AI将来发展的一个方向。”而辩论本身不是为了输赢,而是为了获得更多的决策角度。

“基于循证、基于证据的决策,这是非常大的待开发的AI领域,所以可以通过辩论去实现这一个领域的落地。”Aya Soffer博士强调。虽然有着广泛的应用场景,科学家们也表示,目前Project Debater还处在研究初级阶段,没有商业应用的计划。但是,Project Debater具备的自然语言理解相关的能力,会进入到Watson产品为更多企业服务。

ded20db0821693434ee0fa9af78ff71f0f004cec

IBM海法研究院Project Debater 首席研究员Noam Slonim博士(右)、Project Debater 全球经理Ranit Aharonov(左)接受视频采访

Debater是如何应对即兴、不可预测的辩论内容的?

在6月份旧金山的公开辩论赛中,Project Debater事先没有拿到任何辩题。和人类选手一样,拿到辩题后只有30分钟的准备时间。在这期间,Project Debater需要首先分析辩题,然后扫描拥有3 亿多个可靠信息来源的庞大语料库,通过算法找出与辩题相关性最高的观点性内容,同时减少重复信息,最终形成有说服力的论点和支撑论据。

这一过程中,Project Debater主要依靠三大能力:一,数据驱动的演讲稿撰写和表达,即从大量语料库中寻找素材并撰写结构良好的演讲内容;二、听力理解,能够识别长段连续口语中隐含的重要概念和观点,这与只需要听懂一句话的语音助手完全不同;三、模拟人类困境(dilema),针对性地提出有原则的论点。

在自由辩论环节,Project Debater很难预测对方会怎样说。那么,它是如何实时应对完全即兴的、不可预期的辩论内容,并做出针对性的反驳的?这可以说训练Project Debater辩论时最大的挑战。

Noam Slonim博士详细解释了Project Debater如何应对这一挑战:通过构建知识图谱,针对不同论证中的共同点建模,形成辩驳的能力。

“举个例子,比如说涉及到是否要禁止人体器官贸易,是否要禁止酒精贸易。人们可以自然而然地推断出,如果禁止相关交易,将导致黑市蓬勃发展的风险。模拟这一场景,可以为Project Debater建模,当遇到类似有关禁止类型的辩题时,Project Debater就可以依据模拟好的知识图谱,等待着与黑市相关话题的出现,然后去寻找与黑市相关的论证就可以了。”

但是事情没有这么简单。比如美国最近讨论比较多的热门话题,是否禁止在公共场合母乳喂养。同样是禁止相关内容,但跟黑市一点关系都没有。

“所以我们需要在这些方面不断去建模、扩大语料库,包括人类丰富的语言中各种细微和微妙的地方。这样Project Debater在已经建模的知识图谱中,才能够更加精准地为自己导航,找到支持自己论点的内容。”Noam Slonim博士强调。

Project Debater的学习模式

学会辩论的Project Debater是否会像Alpha Go那样能够自动学习,越来越聪明?

科学家们解释说,Project Debater并没有用到训练Alpha Go的强化学习工具。强化学习是机器学习中一个重要的类型,其典型特点就是在没有人为指导的情况下,通过不断的“试错”获得反馈来提升任务性能。但反馈需要明确的衡量标准,比如会导致游戏赢还是输。

但是Project Debater的辩论场景是开放式、不是非赢即输的,人们对于辩论陈述的好坏评价是非常主观的判断。进化君理解,Project Debater 的训练中使用了深度神经网络和弱监督学习。深度神经网络(DNN)和弱监督都要用到有标签的数据去培训机器做出正确的回答。

据介绍,除了人工标签,研究人员还教会Project Debater通过关键词判别标签,比如一旦句子中出现“认为”、“想”、“假定”、“相信”等表达,这就判定为属于陈述内容。科学家开发了多种工具和方法,以弱监督方式训练DNN,以获得训练需要的大量人工标记的高质量数据。

此外,Project Debater是否会向人类中的一级辩手中学习?

Ranit Aharonov博士表示,“在涉及到通过建模去模拟人类困境的时候我们听取顶级辩手的意见,参考他们是如何应对在同样一个话题下不同观点的冲突。”

f8a9da8a73bddc3383e6b1e970e987319e360b71

Project Debater的构成要素与潜在应用(来源:IBM海法研究院)

Project Debater的下一步,让人工智能更像人

作为项目的首席研究员,Noam Slonim博士加入IBM已经11年了,自2012年至今都专注于Project Debater的研究。虽然Debater团队成员已经在各种高质量科学会议上发表了30多篇作品,并开创了计算辩论(Computational Argumentation)这一全新领域,但Noam Slonim博士认为Project Debater处在早期的阶段,有长足发展空间。“有太多有趣的问题等着我们去发掘。就计算辩论本身而言就有太多有趣的问题。”

Noam Slonim博士认为,在亚里士多德提出的辩论三元素(logos逻辑、pathos情感、ethos可信)中,目前的AI研究还需要超越logos(逻辑)阶段。

Project Debater的最终目标也许并不是让机器像人一样自由辩论或者比人辩论得更好,而是促进AI在语言理解领域的研究。语言理解一直都AI领域的重点,也是IBM在AI研究方面关注的重点。科学家们认为,目前所有企业在这个方面的研究还远远不够。

“Project Debater下一步是怎么样的,就是要让人工智能更像人。我们希望AI下一步的发展是从比较窄的例子上学习,扩展到比较宽泛的领域、跨不同领域的应用,以及能够从概念上学习。不是仅仅是再学习的能力,而是自己去推理的能力。”Aya Soffer博士表示。


原文发布时间为:2018-09-25

本文作者:进化君

本文来自云栖社区合作伙伴“趣味科技v”,了解相关信息可以关注“趣味科技v”。

相关文章
|
14天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
70 9
|
25天前
|
人工智能 自然语言处理 机器人
对话阿里云 CIO 蒋林泉:AI 时代,企业如何做好智能化系统建设?
10 月 18 日, InfoQ《C 位面对面》栏目邀请到阿里云 CIO 及 aliyun.com 负责人蒋林泉(花名:雁杨),就 AI 时代企业 CIO 的角色转变、企业智能化转型路径、AI 落地实践与人才培养等主题展开了讨论。
766 67
对话阿里云 CIO 蒋林泉:AI 时代,企业如何做好智能化系统建设?
|
24天前
|
存储 人工智能 自然语言处理
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
|
13天前
|
机器学习/深度学习 人工智能 搜索推荐
AI在医疗领域的革命:智能诊断系统的未来
在科技日新月异的今天,人工智能(AI)技术正逐渐渗透到我们生活的每一个角落,其中医疗领域尤为显著。本文将探讨AI在医疗诊断中的应用及其带来的变革,重点介绍智能诊断系统的发展现状与未来趋势。通过深入浅出的方式,我们将揭示AI如何改变传统医疗模式,提高诊断效率和准确性,最终造福广大患者。
|
19天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
129 6
|
18天前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
37 4
|
12天前
|
人工智能 自然语言处理 安全
AI技术在智能客服系统中的应用与挑战
【10月更文挑战第28天】本文将深入探讨人工智能(AI)技术在智能客服系统中的应用及其面临的挑战。我们将通过实例分析,了解AI如何改善客户服务体验,提高效率和降低成本。同时,我们也将关注AI在实际应用中可能遇到的问题,如语义理解、情感识别和数据安全等,并提出相应的解决方案。
|
14天前
|
安全 搜索推荐 机器学习/深度学习
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】在人工智能的推动下,个性化学习系统逐渐成为教育领域的重要趋势。深度学习作为AI的核心技术,在构建个性化学习系统中发挥关键作用。本文探讨了深度学习在个性化推荐系统、智能辅导系统和学习行为分析中的应用,并提供了代码示例,展示了如何使用Keras构建模型预测学生对课程的兴趣。尽管面临数据隐私和模型可解释性等挑战,深度学习仍有望为教育带来更个性化和高效的学习体验。
40 0
|
22天前
|
人工智能 自然语言处理 机器人
对话阿里云CIO蒋林泉:AI时代,企业如何做好智能化系统建设?
10月18日, InfoQ《C 位面对面》栏目邀请到阿里云CIO及aliyun.com负责人蒋林泉(花名:雁杨),就AI时代企业CIO的角色转变、企业智能化转型路径、AI落地实践与人才培养等主题展开了讨论。
|
1月前
|
机器学习/深度学习 存储 人工智能
2024年诺贝尔奖:AI科学家的辉煌时刻 | AI大咖说
在今年的诺贝尔物理学奖和化学奖颁奖典礼上,AI科学家分别摘得了这两项殊荣,这无疑为AI技术的发展和应用注入了新的动力【10月更文挑战第5天】
62 0

热门文章

最新文章