智造观点
近日,UberAI开源了“柏拉图研究对话系统”,用于构建、训练和部署会话AI代理,使数据科学家和业余爱好者能够从原型和演示系统中收集数据。柏拉图拥有简洁明了的设计,与现有的深度学习、贝叶斯优化框架(用于调整模型)集成,可减少编写代码的需要。目前,柏拉图支持通过语音、文本或结构化信息进行交互,可以为会话代理的每个组件包裹现有的预训练模型,并且每个组件都可以在线或离线进行训练。
最近,Uber发布了一个名为“柏拉图研究对话系统”(PlatoResearchDialogueSystem)的开源人工智能平台。该系统将与谷歌的Dialogflow、微软的Bot框架和亚马逊的Lex等类似产品竞争。
UberAI研究团队在博客中解释说,柏拉图主要为构建、培训和部署原型和演示系统而设计,还可以促进会话数据收集。Uber还表示,柏拉图是数据科学家和业余爱好者们的理想选择,其“简洁明了”的设计,以及与现有的深度学习和贝叶斯优化框架(用于调整模型)集成,可减少编写代码的需要。
目前,柏拉图可以通过语音、文本和“结构化信息”支持与人类、数据和其他对话式AI代理进行交互。最重要的是,它可以为会话代理的每个组件包裹现有的预训练模型,并且每个组件都可以在线(在交互期间)或离线(从数据)进行训练。鉴于柏拉图是一个通用框架,所以每个单独的组件都可以使用任何机器学习库(例如,Ludwig、TensorFlow或 PyTorch)进行在线或离线训练。柏拉图还拥有“模块化设计”,可将数据处理分成七个部分,包括语音识别、语言理解、状态追踪、API 调用、对话策略、语言生成和语音合成。
为了证明其可扩展性,柏拉图用户可以通过提供该类模块的Python类名和包路径以及模型的初始化参数来定义自己的体系结构或插入自己的组件。只要模块按照它们应该执行的顺序列出,柏拉图就会处理其余部分,包括包装输入和输出,链接和执行模块(串行或并行),以及促进对话。
在数据记录方面,柏拉图还通过对话片段记录器中记录事件来处理数据记录。录音机记录了以前的对话状态、采取了什么行动以及目前的对话状态。
“我们相信柏拉图能够从Ludwig和TensorFlow到PyTorch、Keras和其他开源项目的深度学习框架中更加无缝地培训会话代理,从而在学术和行业应用中改进对话AI技术。”UberAI研究人员AlexandrosPapangelis、YiChiaWang、MahdiNamazifar和ChandraKhatri在博客中写道,“我们利用柏拉图,可以很容易地训练一个谈话代理如何询问餐馆信息,另一个代理如何提供这些信息,随着时间的推移,他们的谈话会变得越来越自然。”
Constellation Research 公司的分析师Holger Mueller表示,柏拉图系统中最有趣的一点是支持多个代理的技术,这对于Uber来说是必要的,因为它需要促进客户、司机以及客户服务代理之间的多方聊天。
Holger Mueller说:“这意味着需要智能对话共享,尽管聊天机器人框架空间领域已经非常拥挤了,但是Uber推出柏拉图仍具有现实意义,和所有新的开源项目一样,我们需要在几个季度内检查采用情况,因为开源代码资产的行为不能保证开发人员或企业采用。”
另外,柏拉图的发布是在前面提到的Ludwig的首次发布之后,Ludwig是一套建立在谷歌TensorFlow框架之上的开源工具,它允许用户无需编写代码就可以训练和测试人工智能模型。
来源:微信公众号 人工智能观察