「镁客·请讲」奇点机智邬霄云:打造AI语音对话平台,赋能传统行业

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: 个好的对话平台,要能够使用有限的例句进行泛化拓展,利用算法、语料库、知识库训练有效的模型。

个好的对话平台,要能够使用有限的例句进行泛化拓展,利用算法、语料库、知识库训练有效的模型。

语音识别,是目前人工智能落地最成功的领域之一。

从智能硬件再到软件,语音识别的身影几乎无处不在。最早带给大众惊喜的语音助手“Siri”正在一次次更新中走向成熟,百度DuerOS作为一枝新秀被广泛运用到智能家居、车载和智能穿戴等场景中。

纵然语音识别技术发展至今已经有了革命性突破,然而间歇性出现的交互问题依然是这一领域的最大短板。

Google研究院八年工作经验告诉邬霄云,解决问题的关键在于找到导致问题出现的根本原因。

从Google离职后,邬霄云回国组建团队创办了他现在的公司——奇点机智。今年,他的团队致力于打造一款智能语音对话平台——对话流(Conversation Flow Platform)。

TB1ZZIJohTpK1RjSZFMXXbG_VXa.png

图|Naturali 奇点机智创始人兼CEO邬霄云

一、工程思维和长远眼光

人工智能重要技术之一是自然语言处理,机器阅读理解又是自然语言处理的重要问题。

2018年,奇点机智团队获得机器阅读理解技术竞赛的第一名。在这次比赛中,他们之所以能从800多个队伍中脱颖而出,主要得益于团队在自然语言处理(NLP)领域的积累与沉淀。团队75%的成员都是技术出身,他们大多来自微软、谷歌和Facebook等大公司,毕业于北大、清华、浙大、Yale和UCLA等名校。现在,他们又将技术所长运用到“对话流”上。

创始人兼CEO邬霄云坦言,“Google研究室的工作经历给了我很大帮助,我学到的工程思维和长远眼光对创业启发很大。”

所谓工程思维就是从宏大视角出发,用工程技术一次性解决若干个小问题。比如,他们在创业初期就搭建了内部学习平台,之后进行的一系列复杂实验都用这个平台自动记下实验结果,杜绝人工记录可能造成的麻烦,方便以后继续开展实验。而长远的眼光则教会他把握住未来趋势,哪怕眼前困难重重,也要努力克服,这样才能摘得最大的果实。

他会选择创业,一是被同学们的创业激情感染,二是看到智能语音市场的红利。

邬霄云说,“在中国,人机交互是一个巨大的市场,现在它需要很好的解决方式。”

对于一家企业来说,维护和用户之间的关系尤为关键,失掉用户等于失去市场竞争力。为了解答用户在使用产品和服务上的问题,很多企业雇佣了一大批人工客服。但人工客服成本高,且不可能24小时在线,于是智能客服应运而生。这不但节省了企业在客服上的开支,还使用户即时获得常规问题的解答,这对企业来说如虎添翼,现今很多互联网平台和线下场景都运用到这项技术。

确定好发展方向,剩下的事情就是不断攻坚,实现技术上的突破。自2015年创立以来,奇点机智陆续推出多款产品,完成一次次跨越。

TB1F9gDoXzqK1RjSZSgXXcpAVXa.png

图|Naturali 奇点机智于2018北京双创周参展

二、赋能传统行业,实现“从需求到服务”的完整闭环

创业初期,奇点机智集中打造一款To C语音助手APP,同时也在给一些厂商做内置语音助手。现在他们的战略中心则是To B市场,AI对话平台“对话流”因此诞生。

通过这个平台,企业能够在WEB、APP、小程序、微信公众号和智能硬件等终端中创建出内部服务、客服、应用助手和聊天机器人等产品,满足客户的需求。即使企业缺乏技术背景,也能借助“对话流”平台去实现智能语音对话功能。

想要在竞争日益激烈的智能语音市场取得成绩,企业必须有核心价值。和其他同类竞品相比,奇点机智最大的优点在于它能理解用户意图。

假如用户想得知一款产品是否有折扣,点开智能客服的对话窗口,就能询问产品的折扣力度。一般而言,市面上大多数智能客服通过匹配关键词向用户传输优惠信息,因此用户的询问必须包括商家或平台提前输入的关键词,否则机器无法正确识别出用户输入的信息。而“对话流”强大的语言理解能力赋予它超过一般对话平台的水准,即便用户没有说出关键词,只要意思相近,“对话流”就能迅速理解并给出答复。

邬霄云表示,“一个好的对话平台,要能够使用有限的例句进行泛化拓展,利用算法、语料库、知识库训练有效的模型。”

除此之外,奇点机智还能为用户提供高度灵活定制的语音对话体验。将来“对话流”的使用场景将会非常广泛,银行的咨询服务、商家智能客服和售后、医疗智能问诊等等场景都适用。

TB1tLIFogHqK1RjSZFgXXa7JXXa.png

图|邬霄云向技术从业人员分享机器阅读理解技术

最后

今年对话平台被Gartner评为2018年十大战略技术趋势。如今它还在快速增长,相关产品已经实现大范围商用,百度DuerOS、阿里AliGenie和腾讯云小微都是其中的佼佼者,无论是技术,还是市场,或者是消费者的口碑,都占有一席之地。在2018年百度世界大会上,百度相关负责人表示,DuerOS激活设备数突破1.5亿,月活跃设备超3500万,落地主控设备160+。

未来对话平台的产业链将得到不断细分,生态会逐渐丰富,它将成为智能语音市场最有前景和活力的细分领域之一。

相关文章
|
28天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
84 9
|
25天前
|
存储 人工智能 文字识别
利用AI能力平台实现档案馆纸质文件的智能化数字处理
在传统档案馆中,纸质文件管理面临诸多挑战。AI能力平台利用OCR技术,通过图像扫描、预处理、边界检测、文字与图片分离、文字识别及结果存储等步骤,实现高效数字化转型,大幅提升档案处理效率和准确性。
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI驱动的个性化学习平台构建###
【10月更文挑战第29天】 本文将深入探讨如何利用人工智能技术,特别是机器学习与大数据分析,构建一个能够提供高度个性化学习体验的在线平台。我们将分析当前在线教育的挑战,提出通过智能算法实现内容定制、学习路径优化及实时反馈机制的技术方案,以期为不同背景和需求的学习者创造更加高效、互动的学习环境。 ###
50 3
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
医疗行业的语音识别技术解析:AI多模态能力平台的应用与架构
AI多模态能力平台通过语音识别技术,实现实时转录医患对话,自动生成结构化数据,提高医疗效率。平台具备强大的环境降噪、语音分离及自然语言处理能力,支持与医院系统无缝集成,广泛应用于门诊记录、多学科会诊和急诊场景,显著提升工作效率和数据准确性。
|
2月前
|
人工智能
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
56 1
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
|
1月前
|
SQL 人工智能 DataWorks
DataWorks:新一代 Data+AI 数据开发与数据治理平台演进
本文介绍了阿里云 DataWorks 在 DA 数智大会 2024 上的最新进展,包括新一代智能数据开发平台 DataWorks Data Studio、全新升级的 DataWorks Copilot 智能助手、数据资产治理、全面云原生转型以及更开放的开发者体验。这些更新旨在提升数据开发和治理的效率,助力企业实现数据价值最大化和智能化转型。
247 5
|
2月前
|
存储 消息中间件 人工智能
ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用
本文整理自2024年云栖大会阿里云智能集团高级技术专家金吉祥的演讲《ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用》。
|
2月前
|
存储 人工智能 开发者
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
87 0
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
|
2月前
|
人工智能 语音技术 数据格式
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
39 0
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
|
25天前
|
机器学习/深度学习 人工智能 算法
AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营
10月30日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·吉林大学站圆满结营。