
本文内容来自GTC(GPU Technology Conference)2024会议上的对话实录,经本刊编辑和节选
导读:在GTC2024会议上,OpenAI首席运营官Brad Lightcap与NVIDIA企业计算部门副总裁Manuvir Das分享了其对现有模型的思考和未来模型演进的预测,并为中小企业部署AI提出了一系列建议。
在GTC2024会议上,OpenAI首席运营官Brad Lightcap与NVIDIA企业计算部门副总裁Manuvir Das进行了长达45分钟的深入对话,探讨生成性AI的现状与未来。Brad Lightcap强调通过提高AI的推理和执行能力,AI系统将变得更加智能和自主,有效地解决复杂问题并实施具体行动。
OpenAI正在加速模型推理能力的提升,并探索AI在情感智能、创造力和道德判断等多维度的发展。Brad Lightcap分享了其对现有模型的思考和未来模型演进的预测,并为中小企业部署AI提出了一系列建议,包括“从有限的问题开始”、“让每个员工平等地有机会自由使用GPT是最好的方法”、“GPTs和定制化模型的选择”、“从人力资源的角度考虑部署AI”等等。这场对话展示了对AI技术未来发展的深刻洞察,积极推动技术创新,并重视社会责任的思考。
AI的未来与企业应用:从有限问题出发,再扩大规模
Manuvir Das:Brad,能否介绍一下你在OpenAI的角色及日常工作,以及有什么让你夜不能寐的事情?
Brad Lightcap:作为OpenAI的首席运营官,我的工作重点在于将研究实验室的成果转化为客户、用户和合作伙伴的实际应用。我大部分时间投入在与客户的互动中,试图理解这项技术如何融入并改变世界。除了Slack(协同办公平台,指员工内部群组的交流),现在没什么能让我夜不能寐的。
我认为未来几年将会非常有趣。我们现在仍然处于AI技术发展曲线的初始平坦阶段,这好比是一场比赛的第一局边缘。随着我们对这些技术的发展和深入,我相信这些技术的潜能将非常惊人。
Manuvir Das:很多人认为OpenAI就是ChatGPT,并将其看作是普通消费者体验技术的入口,但其实你们现在与大多数ToB客户都在合作,企业们通过OpenAI构建了应用。所以我非常好奇您在与企业客户合作方面的经验。
Brad Lightcap:当ChatGPT推出时,我们看到了显著的用户增长,它不是专为企业设计的,我们花了六个月时间弄清楚发生了什么。去年下半年,我们开始意识到企业中有一些真正的应用场景,公司开始引入ChatGPT。这就是我们推出ChatGPT企业版的原因。
让我们感到真正兴奋的是,我们的产品不仅吸引了中小企业和中端市场,甚至连500强企业也开始使用。现在超过90%的500强企业在使用ChatGPT,我们正在努力使他们接入更专业的企业版。令人惊讶的是,每个公司的每个职能部门都找到了利用这项技术的方法,并且不需要我们构建许多专门的垂直应用。
举例来说,财务团队需要分析大量数据,试图进行账目核对和税务分析,可以直接将庞大的电子表格导入到ChatGPT,并向它提出对账要求,对账会自动完成。同样的,这项技术甚至可以将HR团队转变为数据科学家。人们自然而然地找到了这项技术的适用性,并且我们也正在努力为他们开发更优秀的工具版本。
Manuvir Das:这确实令人惊叹。我们在与企业客户交流时发现,其中最受欢迎的用例就是作为“助手”,就像拥有一个免费的实习生一样。无论你负责哪个职能部门,似乎都可以构建一个聊天机器人来协助你完成工作,并且它能给出80%的答案,然后你就可以基于它完成剩下的工作。你们也观察到了这种趋势吗?
Brad Lightcap:没错。在某些情况下,还需要一些“最后一公里”的工程投入,所以我们有专业团队来协助客户实现这一点。我认为随着模型的改进,这些挑战中的一部分将会减少。
我们目前看到的是两个需要改进的方面:一是需要解决模型能力上的缺陷,二是尝试构建模型所需的各种上下文的组合。我不认为第二部分的问题会消失,因为世界是如此庞大且复杂,但我相信随着模型的改进,第一部分的问题将会得到解决。
Manuvir Das:围绕OpenAI,已经形成了一个完整的工具生态系统,我很好奇你们是否认为自己的使命和角色是“开发人员使用技术的全平台”,还是仅仅想成为“核心模型服务的提供者”?
Brad Lightcap:我认为两者兼顾。我们的看法是,一切都是对智能的提取,关键在于我们想构建多少层。我们将开发任何我们认为能够加速AI能力提升的事物,将技术和智能带入我们认为合适的每一个角落和缝隙。
我们开始意识到这个世界有多么广阔,我们的技术有很多的应用场景。每当我投入精力考虑是否开发特定的第一方应用程序时,我都会提醒自己,总有人对某个问题更为投入和关心。这就引出了一个问题——我们如何构建一套工具,使开发者能够创造出自己所需的技术、工具和应用?我们的专注点在于创造那些基本的、原始的能力,为创造卓越用户体验服务。
Manuvir Das:NVIDIA有一种信念,我们致力于做那些别人做不到的事。别人能做的,我们就让他们去做。拥有如此强大的工具,你必然会感受到驱使工具尽可能地优秀和有影响力的责任感,并且鼓励其他人围绕工具创造新事物。正如你所说的,你可以用这个工具来影响整个世界。
同时我在思考另一件事,正如Jensen Huang(黄仁勋)在演讲中提到的,科技行业在100万亿美元市场中一直都是以降低成本为目标的。每个公司都需要一个IT部门和一个预算,一切都是围绕如何降低成本进行的。新技术之所以被誉为是颠覆性的,通常是因为它可以以更低的成本完成目标。在OpenAI和NVIDIA所在的领域,实际上是一个关于创造新机会、为公司创造新价值的话题。
Brad Lightcap:确实,我们对此有相同的看法。如果从根本上思考技术的本质,实质上是能将特定任务逐渐转移给能学习的模型的一种能力。这些模型不仅具备广泛的学习能力,而且随着时间推移会不断进步。我们预期,随着规模、知识、背景和能力层面的增长,这些模型将持续得到改善。
令人兴奋的是,从企业角度出发,你会意识到大型企业有多么复杂,以及有多少成果可以轻易实现。对于特定任务,我们已能将其部分工作流程委托给AI。这不仅仅是在基线水平上完成任务,而且随着时间的推移,AI可以做得更好,并逐渐成为价值链的重要组成部分。这使得人们能够将注意力集中在更为重要的事务上。
这正是我们在实践中见证的情况。AI可以帮助你探索问题并找到答案,例如让原本需要花费几个小时才能解决的对账工作变得轻而易举。一个简单的询问,问题便迎刃而解。而那些原本需要时间来处理这些问题的人员,现在可以把精力用于更加重要的事务。
Manuvir Das:我相信产业界的朋友都有这个问题:OpenAI的模型已经非常出色地吸纳了互联网上的知识,而每个公司都有自己的知识库,存放在各种不同的地方。大家对如何利用这些数据都有自己的看法和方法。对于OpenAI,你们是如何帮助这些公司把他们所掌握的数据融入到流程中的?
Brad Lightcap:这确实是我们被问最多的一个问题。当前,这也是最少被解决的问题之一。我们正处于范式转型的初期阶段,人们开始了解和尝试核心技术,但将所有基础设施和系统与之挂钩还需要一些时间。
但正如我们开始看到的那样,人们正在学着如何将数据库与明确的用例相结合,并让模型应用于这两者。当把这三个事情联系在一起,就可以获得非常好的效果。
最近我们与Klarna(财务公司)的合作就是一个很好的例子。Klarna在AI领域有着前瞻性的思维,他们已经做了一段时间。他们从一个非常具体的技术入手,限制问题在一个小范围内。在工作流非常小的一部分内,有一个具体的数据集,一个具体的模型进行微调。
我们建议的方法是:一开始不要做得太多,不要试图一口气吃下整个海洋,但也不要把目标定得太低。应该从一个清晰界定的问题入手,首先让它工作起来,然后逐步扩大规模。
光谱的两端:GPTs和定制模型
Manuvir Das:我注意到你在多次采访中提到,有些公司似乎期待通用人工智能(GenAI)能奇迹般地为他们的公司带来好转,改变在市场上的地位。但实际上,更明智的方法是从具体的用例开始,先从中获得价值,然后进一步拓展。
对于那些刚开始尝试这项技术的公司,你会如何建议他们?例如英伟达,有上百个聊天机器人在内部运行于不同场景,已经是一种有机生长模式。但对于新手,你会建议他们先花时间思考如何规划,选择一个起点?还是广泛尝试,然后顺其自然?
Brad Lightcap:在2023年的大部分时间里,我经常对我们的团队说,我们实际上不是在销售,我们是在进行“心理治疗”。客户通常是C级高管,他们坐在会议室里,大约五分钟后,他们就开始倾诉所有的问题和担忧,问我们是否有办法解决。通常我们得先安慰他们一下,让他们冷静下来。
一旦我们开始进入实质性的对话,我们的观点是,认真考虑下你的业务在哪些方面有改进的机会,例如运营方式、管理方式。对很多公司来说,最头疼的问题通常是客户反馈。几乎没有人对他们的客户体验反馈感到满意,而这些体验往往成本高且效率低下。
Manuvir Das:这恰好是一个非常横向的领域对吗?因为它涉及许多行业。
Brad Lightcap:没错。因此,我们倾向于采用多管齐下的策略。首先,你应该确定两到三个确实具有挑战性的领域,同时这些问题应该有一定的界限。
以客户支持为例,这是一个由多任务组成的工作流程,涉及不同的人、不同的参与程度,有大量数据和上下文信息会有助于解决问题。所以,企业可以回顾前面提到的数据、流程和模型能力这三个方面,确定最初的实施方案是什么样的,然后从那里开始,不断扩大和推广,再挑选几个这样定制化、基于平台的项目来推动。
我的另一个建议是,让整个团队都尝试使用AI应用工具。它可以是一个非常简单的形式,只要给人们机会去尝试,发掘这项技术的潜力,找出它如何能够帮助他们更好地完成工作。我们认为,90%的价值来自于让人们开始使用这些工具,而不必过于深入考虑使用,工具民主化、给人们平等地接触和使用这项技术的机会是很重要的。
Manuvir Das:因为你第一次尝试时就能够明显看到它的价值,你就会愿意为之努力。在与企业客户合作并为他们提供不同使用场景的过程中,你们现在也推出了GPTs的自定义模型,人们可以轻松构建。为什么会选择这条路?进展如何?
Brad Lightcap:从战略层面来看,GPT-4以及之后的产品中,我们都拥有非常核心的智能。我们考虑的是,人们如何使这些技术或模型更个性化,更好地适应手头的任务,提高在任何特定事务上的效率。我们在过去几个月中所做的许多工作,包括GPTs、定制模型,都是朝这个方向发展的。
可以将GPTs和定制模型视为光谱的两端:GPTs代表的是一种相对简单和直接的途径。你可以从ChatGPT的功能中挑选出一部分,将其应用于特定的任务。例如,你可能需要模型记住特定的信息、能够调用外部数据、处理PDF或电子表格、展现特定的个性或者以一种可预测和一致的方式使用工具。只要简单描述需求,GPTs就能自动进行相应的配置。企业界对此需求巨大,因为人们开始意识到这项技术可以应用于很多工作流程,他们只需要正确地编码需求并调用即可。
定制模型则位于光谱的另一端,是一种全方位的定制化服务。对于特定的使用场景,我们会深度调整和优化GPT-4或其他模型,以确保在该领域内的最佳性能。这种服务我们提供的相对较少,因为它对我们来说是资源和时间上的大投入。现在早期阶段仍在不断探索和试验,但已成功提高了定制模型在大量领域的能力表现。
Manuvir Das:增强模型在各个领域的能力是一个令人着迷的进程。过去一年里,我们看到了模型生态系统的蓬勃发展。企业内部,你是否认为大型模型和小型专业模型都将扮演角色?还是说只需一个大模型就可以应用于不同场景?
Brad Lightcap:每种模型都有其用武之地。关于如何思考企业的AI部署,我倾向于将其映射到如何从人力资本的角度构建现代企业。比如,企业不会聘请25000名博士来运营一个公司,因为那是过度配置;实际上,你可能只需要五到十个博士。同理,你也不会把“GPT-X”或最新的大型模型应用到每个单独问题上,你可能需要多样化的模型组合,将不同模型进行调整和优化应用于不同场景。随着时间推移,这些模型的整体性能将越来越好,因此对它们进行定制、微调,以便在任何给定领域都能表现出色的需求会有所减少。
但显然,我们不需要一个一体化模型来解决所有问题。目前,我们正在努力的方向之一,是让人们能够根据具体的使用场景,动态地调用不同的模型,使智能资源分配更为合理。
或许可以将这种多样化的模型想象成公司内不同级别和角色的人,有实习生级别的模型、中层管理者级别的模型、高级管理者级别的模型、以及某些专门领域的专家级模型,每个级别和角色都有其存在的位置和价值。
再补充一点,关于如何在企业部署AI,我们将模型能力映射到人力资源的结构上,但不断变化的是模型能力本身,基本每6个月就会获得提升。例如曾经被视为实习生级别的模型,6个月后就开始看起来有点像中层副总裁级别的模型了;而之前的中层副总裁级别模型也开始像高级总监级别模型。公司需要灵活应对这些变化。
Manuvir Das:这是一种新形式,让我想起iPhone问世时有一种观点认为,iPhone对消费者来说很好,但公司将很难采用,因为它缺乏控制。现在回头看似乎也很可笑。
未来模型的发展方向:推理和解决多步骤问题的能力
Manuvir Das:我在与一些已经走在前沿的客户交谈时注意到,他们开始从过去用AI作为某种形式的信息检索,转变到想要使用AI技术作为助手,并试图在公司内部执行操作、运行流程、调用功能等。你认为目前的这样的技术水平如何?如果我有一个助手,只是确认它的输出可以,但如果我让它为我执行操作,我就必须更加信任它对吗?
Brad Lightcap:这正是让我感到兴奋的地方。在很大程度上,这也反映了我们对这项技术的看法和我们认为它应该如何被使用。
在某些方面,我们甚至有点嘲笑当前AI系统的工作方式,特别是那些基于信息检索的应用。在某种程度上,这些系统像是全世界最糟糕的数据库——它们运行缓慢、成本高昂、非100%准确。即使它们在不断改进,但我们为什么要把它们当成数据库使用呢?为什么要将它们用于某种高精度召回?这种使用方式似乎有些不合理。
我并非在批评,但我们期望看到这些系统向着推理智能体的方向发展。关键在于如何利用模型在数据源中提取信息的核心能力,思考这些信息,然后基于对这些信息的理解做出合成判断,并采取行动。
要做到这一点,需要两个关键条件:首先,提升模型的推理能力;其次,给予模型某种执行能力,让它能够在现实世界中采取实际行动。我认为,这将是未来发展的两个主要趋势。
我们预见模型推理能力的提升将是接下来发展的重点,以及如何赋予模型解决多步骤问题的能力。以医疗保健为例,如果我们能将模型指向医疗记录,它不仅能提取信息和进行基本操作,也许还能开始提供对治疗有洞察力的建议。它可能会帮助追踪患者状况、协助诊断和处方。最终进入一个闭环,与患者讨论用药情况,提醒他们何时服药,以及后续的跟进。这就是我们设想的,人工智能系统在未来几年的发展方向。
Manuvir Das:那你认为这种情况会发生吗,是因为核心模型在这方面的能力会变得更强?还是看到一种方法,即会有一个独立模型或系统专门用于推理,以补充现有模型?
Brad Lightcap:我认为现在的系统已经相当出色,包括从推理到一步步解释思路。现在的挑战是,模型是否能够执行推理路径中的每一步,并判定具体执行哪些操作,以及是否能够获取执行所需的资源。
Manuvir Das:从你的视角看,在接下来的一年、三年和五年内,会有哪些重大转变,或者说,你们在做的工作,能真正改变人们使用这项技术的方式是什么?
Brad Lightcap:我们不认为模型的核心能力已经接近天花板了,未来的发展潜力巨大。从我的视角来看,我们之前讨论的一个挑战是,在生产和部署环境中实现这些系统的有效运作,需要具备哪些标准、框架和工具来组织所需的信息。工作的一部分是构建系统本身,另一部分则是确保我们有途径去部署这项技术并让其在现实环境中真正发挥作用。
让全世界共享技术普惠
Manuvir Das:作为一家公司,你们可以选择专注于整体提升技术,就像你们现在所做的;也可以选择专注于服务企业客户、全球各行业以及整个商业领域,因为那里存在大量的机会。那么你们的思路和重点是什么?
Brad Lightcap:确保这项技术的益处能够被广泛分享,就是我们的使命。如何实现这一点呢?一方面是确保人们能够基于这个平台创新,就像我之前提到的,世界太过庞大和复杂,我们不得不这么做。虽然接口和数据提取的层次可能会变化,但核心目标是提供有效的工具和途径,让人们不管在哪里都能使用这些技术。
我们的联合创始人GregBrockman有一个很好的比喻,那就是我们可以以这种方式去思考世界:人工智能被烘焙进了经济之中。“烘焙进去”的意思是,你需要将各种原料混合在一起,等待一段时间后,开始发挥作用。我们也经常这样想,即我们如何部署这项技术,融入其他“原料”,可以让它们一旦混合在一起,就会以不同的方式运作。
这项技术都具有一种与生俱来的人性化特质——你可以把它交给5岁或95岁的人使用,他们都能自然地使用。我们应该继续推动系统朝着提高可及性的方向发展,并降低获取门槛,确保全球人民都能接触到它。
Manuvir Das:你认为让人类以更自然的方式与这项技术互动,能为其全球普及带来机会吗?
Brad Lightcap:我相信今天出生的孩子与计算机的关系,跟我们相比,会截然不同。
他们根本不会知道必须浏览图形用户界面、下拉列表,要填写文本框、点击提交,然后等待确认邮件被发送到收件箱的那些令人痛苦的情景。对于今天出生的孩子来说,这些都将成为完全陌生的体验。10年后、20年后,他们将完全改变与计算机交互的方式。
Manuvir Das:实在让人激动,可能在未来不远的某一天,我们都将为这场技术革命做出自己的贡献。