IBM海法研究院Project Debater 首席研究员Noam Slonim博士(左)、Project Debater 全球经理Ranit Aharonov博士(右)
还记得Project Debater吗?IBM今年推出的首个能与人类辩论的AI系统。
今年6月,Project Debater参加了在旧金山举行的与人类辩论高手PK的公开辩论赛。在没有提前获知辩题的情况下,Project Debater依靠强大的语料库,独自完成陈述观点、反驳辩词、总结陈述的整个辩论过程。智能进化论曾做过详细报道,《AI首次实现与人类辩论,IBM Project Debater真正想突破的是什么?》
9月7日,进化君视频采访了Project Debater团队的几位科学家,包括来自以色列IBM海法研究院的Project Debater首席研究员Noam Slonim博士、Project Debater团队经理Ranit Aharonov博士,以及IBM AI Tech副总裁Aya Soffer博士。
IBM为什么要研究会辩论的AI?Project Debater遇到的难题是什么?创新在哪里?下一步将如何发展?关于外界关注的这些问题,几位科学家用通俗易懂的表达做了详尽解释。
IBM为什么要教机器辩论?
当Watson 2011年在《危险边缘》(Jeopardy!)益智问答中击败人类选手后,IBM的AI研究人员便开始寻找下一个具备重大挑战的研究领域。科学家们希望,新的方向既要与人类实际生活相关,在难度上又要超越AI此前能够解决的挑战。
虽然公开辩论不是一个常见的场景,但辩论的能力却是人们制定决策的关键,不管在日常生活还是工作中。被誉为批判性思维(Critical Thinking)圣经之作的《学会提问》一书中指出,无论总统还是普通人,都要面临一个问题,那就是当别人告诉你要做A,要做B,甚至A和B 是相反的意见时,我们需要运用批判性思维,在这些不同的意见中做出独立的明智的决策判断。
Aya Soffer博士介绍,“真实世界中,我们并不需要像《危险边缘》那样完成很多琐碎的知识问答,而是要回答真正重要的问题,并做出真正重要的决策。决策的重要性决定了我们确定要把辩论功能作为AI的下一个重大挑战去做相关研究。”
此外,辩论还是一个开放式的挑战,这与之前AI所解决的挑战都不同。此前,不论益智问答还是下围棋、玩电脑游戏,这些活动都有明确的衡量输赢的标准。辩论则像在真实世界中做商业决策一样,没有清晰的以绝对的分数高低衡量输赢的简单标准。
由此,Project Debater的应用主要集中在两个领域,第一是有研究、分析、收集信息需要的人士。如金融分析师、律师、记者、科学家等。他们需要就某一个主题寻找相关信息,并且以相关的方式去组织这些信息,了解其利与弊。
第二个是需要做决策的领域,比如企业董事会成员和高级管理人员。往往他们要做决策是自己尚未充分了解的内容,面临非常多的信息。Project Debater可以帮助他们迅速了解一个问题的正反两面,做出更好的基于证据、基于关键信息的决策。
Project Debater团队经理Ranit Aharonov博士表示,“由AI辅助去解决大多数不是非对即错、非赢即输的问题,将是AI将来发展的一个方向。”而辩论本身不是为了输赢,而是为了获得更多的决策角度。
“基于循证、基于证据的决策,这是非常大的待开发的AI领域,所以可以通过辩论去实现这一个领域的落地。”Aya Soffer博士强调。虽然有着广泛的应用场景,科学家们也表示,目前Project Debater还处在研究初级阶段,没有商业应用的计划。但是,Project Debater具备的自然语言理解相关的能力,会进入到Watson产品为更多企业服务。
IBM海法研究院Project Debater 首席研究员Noam Slonim博士(右)、Project Debater 全球经理Ranit Aharonov(左)接受视频采访
Debater是如何应对即兴、不可预测的辩论内容的?
在6月份旧金山的公开辩论赛中,Project Debater事先没有拿到任何辩题。和人类选手一样,拿到辩题后只有30分钟的准备时间。在这期间,Project Debater需要首先分析辩题,然后扫描拥有3 亿多个可靠信息来源的庞大语料库,通过算法找出与辩题相关性最高的观点性内容,同时减少重复信息,最终形成有说服力的论点和支撑论据。
这一过程中,Project Debater主要依靠三大能力:一,数据驱动的演讲稿撰写和表达,即从大量语料库中寻找素材并撰写结构良好的演讲内容;二、听力理解,能够识别长段连续口语中隐含的重要概念和观点,这与只需要听懂一句话的语音助手完全不同;三、模拟人类困境(dilema),针对性地提出有原则的论点。
在自由辩论环节,Project Debater很难预测对方会怎样说。那么,它是如何实时应对完全即兴的、不可预期的辩论内容,并做出针对性的反驳的?这可以说训练Project Debater辩论时最大的挑战。
Noam Slonim博士详细解释了Project Debater如何应对这一挑战:通过构建知识图谱,针对不同论证中的共同点建模,形成辩驳的能力。
“举个例子,比如说涉及到是否要禁止人体器官贸易,是否要禁止酒精贸易。人们可以自然而然地推断出,如果禁止相关交易,将导致黑市蓬勃发展的风险。模拟这一场景,可以为Project Debater建模,当遇到类似有关禁止类型的辩题时,Project Debater就可以依据模拟好的知识图谱,等待着与黑市相关话题的出现,然后去寻找与黑市相关的论证就可以了。”
但是事情没有这么简单。比如美国最近讨论比较多的热门话题,是否禁止在公共场合母乳喂养。同样是禁止相关内容,但跟黑市一点关系都没有。
“所以我们需要在这些方面不断去建模、扩大语料库,包括人类丰富的语言中各种细微和微妙的地方。这样Project Debater在已经建模的知识图谱中,才能够更加精准地为自己导航,找到支持自己论点的内容。”Noam Slonim博士强调。
Project Debater的学习模式
学会辩论的Project Debater是否会像Alpha Go那样能够自动学习,越来越聪明?
科学家们解释说,Project Debater并没有用到训练Alpha Go的强化学习工具。强化学习是机器学习中一个重要的类型,其典型特点就是在没有人为指导的情况下,通过不断的“试错”获得反馈来提升任务性能。但反馈需要明确的衡量标准,比如会导致游戏赢还是输。
但是Project Debater的辩论场景是开放式、不是非赢即输的,人们对于辩论陈述的好坏评价是非常主观的判断。进化君理解,Project Debater 的训练中使用了深度神经网络和弱监督学习。深度神经网络(DNN)和弱监督都要用到有标签的数据去培训机器做出正确的回答。
据介绍,除了人工标签,研究人员还教会Project Debater通过关键词判别标签,比如一旦句子中出现“认为”、“想”、“假定”、“相信”等表达,这就判定为属于陈述内容。科学家开发了多种工具和方法,以弱监督方式训练DNN,以获得训练需要的大量人工标记的高质量数据。
此外,Project Debater是否会向人类中的一级辩手中学习?
Ranit Aharonov博士表示,“在涉及到通过建模去模拟人类困境的时候我们听取顶级辩手的意见,参考他们是如何应对在同样一个话题下不同观点的冲突。”
Project Debater的构成要素与潜在应用(来源:IBM海法研究院)
Project Debater的下一步,让人工智能更像人
作为项目的首席研究员,Noam Slonim博士加入IBM已经11年了,自2012年至今都专注于Project Debater的研究。虽然Debater团队成员已经在各种高质量科学会议上发表了30多篇作品,并开创了计算辩论(Computational Argumentation)这一全新领域,但Noam Slonim博士认为Project Debater处在早期的阶段,有长足发展空间。“有太多有趣的问题等着我们去发掘。就计算辩论本身而言就有太多有趣的问题。”
Noam Slonim博士认为,在亚里士多德提出的辩论三元素(logos逻辑、pathos情感、ethos可信)中,目前的AI研究还需要超越logos(逻辑)阶段。
Project Debater的最终目标也许并不是让机器像人一样自由辩论或者比人辩论得更好,而是促进AI在语言理解领域的研究。语言理解一直都AI领域的重点,也是IBM在AI研究方面关注的重点。科学家们认为,目前所有企业在这个方面的研究还远远不够。
“Project Debater下一步是怎么样的,就是要让人工智能更像人。我们希望AI下一步的发展是从比较窄的例子上学习,扩展到比较宽泛的领域、跨不同领域的应用,以及能够从概念上学习。不是仅仅是再学习的能力,而是自己去推理的能力。”Aya Soffer博士表示。
原文发布时间为:2018-09-25
本文作者:进化君