「镁客·请讲」奇点机智邬霄云:打造AI语音对话平台,赋能传统行业

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 个好的对话平台,要能够使用有限的例句进行泛化拓展,利用算法、语料库、知识库训练有效的模型。

个好的对话平台,要能够使用有限的例句进行泛化拓展,利用算法、语料库、知识库训练有效的模型。

语音识别,是目前人工智能落地最成功的领域之一。

从智能硬件再到软件,语音识别的身影几乎无处不在。最早带给大众惊喜的语音助手“Siri”正在一次次更新中走向成熟,百度DuerOS作为一枝新秀被广泛运用到智能家居、车载和智能穿戴等场景中。

纵然语音识别技术发展至今已经有了革命性突破,然而间歇性出现的交互问题依然是这一领域的最大短板。

Google研究院八年工作经验告诉邬霄云,解决问题的关键在于找到导致问题出现的根本原因。

从Google离职后,邬霄云回国组建团队创办了他现在的公司——奇点机智。今年,他的团队致力于打造一款智能语音对话平台——对话流(Conversation Flow Platform)。

TB1ZZIJohTpK1RjSZFMXXbG_VXa.png

图|Naturali 奇点机智创始人兼CEO邬霄云

一、工程思维和长远眼光

人工智能重要技术之一是自然语言处理,机器阅读理解又是自然语言处理的重要问题。

2018年,奇点机智团队获得机器阅读理解技术竞赛的第一名。在这次比赛中,他们之所以能从800多个队伍中脱颖而出,主要得益于团队在自然语言处理(NLP)领域的积累与沉淀。团队75%的成员都是技术出身,他们大多来自微软、谷歌和Facebook等大公司,毕业于北大、清华、浙大、Yale和UCLA等名校。现在,他们又将技术所长运用到“对话流”上。

创始人兼CEO邬霄云坦言,“Google研究室的工作经历给了我很大帮助,我学到的工程思维和长远眼光对创业启发很大。”

所谓工程思维就是从宏大视角出发,用工程技术一次性解决若干个小问题。比如,他们在创业初期就搭建了内部学习平台,之后进行的一系列复杂实验都用这个平台自动记下实验结果,杜绝人工记录可能造成的麻烦,方便以后继续开展实验。而长远的眼光则教会他把握住未来趋势,哪怕眼前困难重重,也要努力克服,这样才能摘得最大的果实。

他会选择创业,一是被同学们的创业激情感染,二是看到智能语音市场的红利。

邬霄云说,“在中国,人机交互是一个巨大的市场,现在它需要很好的解决方式。”

对于一家企业来说,维护和用户之间的关系尤为关键,失掉用户等于失去市场竞争力。为了解答用户在使用产品和服务上的问题,很多企业雇佣了一大批人工客服。但人工客服成本高,且不可能24小时在线,于是智能客服应运而生。这不但节省了企业在客服上的开支,还使用户即时获得常规问题的解答,这对企业来说如虎添翼,现今很多互联网平台和线下场景都运用到这项技术。

确定好发展方向,剩下的事情就是不断攻坚,实现技术上的突破。自2015年创立以来,奇点机智陆续推出多款产品,完成一次次跨越。

TB1F9gDoXzqK1RjSZSgXXcpAVXa.png

图|Naturali 奇点机智于2018北京双创周参展

二、赋能传统行业,实现“从需求到服务”的完整闭环

创业初期,奇点机智集中打造一款To C语音助手APP,同时也在给一些厂商做内置语音助手。现在他们的战略中心则是To B市场,AI对话平台“对话流”因此诞生。

通过这个平台,企业能够在WEB、APP、小程序、微信公众号和智能硬件等终端中创建出内部服务、客服、应用助手和聊天机器人等产品,满足客户的需求。即使企业缺乏技术背景,也能借助“对话流”平台去实现智能语音对话功能。

想要在竞争日益激烈的智能语音市场取得成绩,企业必须有核心价值。和其他同类竞品相比,奇点机智最大的优点在于它能理解用户意图。

假如用户想得知一款产品是否有折扣,点开智能客服的对话窗口,就能询问产品的折扣力度。一般而言,市面上大多数智能客服通过匹配关键词向用户传输优惠信息,因此用户的询问必须包括商家或平台提前输入的关键词,否则机器无法正确识别出用户输入的信息。而“对话流”强大的语言理解能力赋予它超过一般对话平台的水准,即便用户没有说出关键词,只要意思相近,“对话流”就能迅速理解并给出答复。

邬霄云表示,“一个好的对话平台,要能够使用有限的例句进行泛化拓展,利用算法、语料库、知识库训练有效的模型。”

除此之外,奇点机智还能为用户提供高度灵活定制的语音对话体验。将来“对话流”的使用场景将会非常广泛,银行的咨询服务、商家智能客服和售后、医疗智能问诊等等场景都适用。

TB1tLIFogHqK1RjSZFgXXa7JXXa.png

图|邬霄云向技术从业人员分享机器阅读理解技术

最后

今年对话平台被Gartner评为2018年十大战略技术趋势。如今它还在快速增长,相关产品已经实现大范围商用,百度DuerOS、阿里AliGenie和腾讯云小微都是其中的佼佼者,无论是技术,还是市场,或者是消费者的口碑,都占有一席之地。在2018年百度世界大会上,百度相关负责人表示,DuerOS激活设备数突破1.5亿,月活跃设备超3500万,落地主控设备160+。

未来对话平台的产业链将得到不断细分,生态会逐渐丰富,它将成为智能语音市场最有前景和活力的细分领域之一。

相关文章
|
7天前
|
人工智能 自然语言处理 API
Mathtutor on Groq:AI 数学辅导工具,实时计算并展示解题过程,支持通过语音提出数学问题
Mathtutor on Groq 是一款基于 Groq 架构的 AI 数学辅导工具,支持语音输入数学问题,实时计算并渲染解题过程,适用于代数、微积分等领域的学习和教学辅助。
34 5
Mathtutor on Groq:AI 数学辅导工具,实时计算并展示解题过程,支持通过语音提出数学问题
|
13天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
17天前
|
人工智能 数据可视化 JavaScript
NodeTool:AI 工作流可视化构建器,通过拖放节点设计复杂的工作流,集成 OpenAI 等多个平台
NodeTool 是一个开源的 AI 工作流可视化构建器,通过拖放节点的方式设计复杂的工作流,无需编码即可快速原型设计和测试。它支持本地 GPU 运行 AI 模型,并与 Hugging Face、OpenAI 等平台集成,提供模型访问能力。
92 14
NodeTool:AI 工作流可视化构建器,通过拖放节点设计复杂的工作流,集成 OpenAI 等多个平台
|
23天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
132 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
7天前
|
机器学习/深度学习 人工智能 安全
阿里云先知安全沙龙(武汉站) ——AI赋能软件漏洞检测,机遇, 挑战与展望
本文介绍了漏洞检测的发展历程、现状及未来展望。2023年全球披露的漏洞数量达26447个,同比增长5.2%,其中超过7000个具有利用代码,115个已被广泛利用,涉及多个知名软件和系统。文章探讨了从人工审计到AI技术的应用,强调了数据集质量对模型性能的重要性,并展示了不同检测模型的工作原理与实现方法。此外,还讨论了对抗攻击对模型的影响及提高模型可解释性的多种方法,展望了未来通过任务大模型实现自动化漏洞检测与修复的趋势。
|
24天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
12月05日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·电子科技大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
|
9天前
|
人工智能 分布式计算 供应链
高效提取图片信息:AI技术赋能企业数字化转型
本文介绍了如何通过AI技术高效提取图片中的结构化信息,提升企业运营效率。具体应用场景包括票据与合同管理、电商商品信息管理、保险理赔和物流单据处理等。AI技术能将传统人工录入流程缩短至秒级,准确率高达99%,减少人为错误,提升客户满意度。方案优势在于易于扩展、灵活高性价比的调用模式及便捷安全的云产品接入。文中还详细描述了部署应用、访问示例应用及使用官方示例进行信息提取的操作步骤,并提供了参考链接和源码下载途径。
|
10天前
|
存储 人工智能 安全
微软推出Copilot Vision AI助手赋能网页浏览与决策
微软推出Copilot Vision AI助手赋能网页浏览与决策
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
师资研修|AI赋能教师教学能力转型-德阳某教育主管部门
近日,德阳市教育主管部门,面向全市中职院校的骨干教师,开展AIGC赋能教育教学师资培训。TsingtaoAI参与负责本次师资研修的教学。本次师资研修通过系统化、专业化的培训,帮助教师深入掌握AI大模型及生成技术在教学中的应用。课程以实践为核心,以案例为载体,涵盖AI提示词优化、教案与题库生成、PPT高效设计及AI数字人应用等核心内容,全面提升教师的教学效率与创新能力。
55 5
|
13天前
|
人工智能 Serverless 视频直播
活动实践 | AI智能体实时语音互动
AI智能体实时语音互动方案提供端到端的实时音频交互,用户通过终端SDK与云端AI智能体进行音频通话。AI智能体接收音频输入,依据预定义工作流处理并生成响应,通过ARTC网络推送结果。该方案支持灵活编排AI组件如语音转文字、大语言模型等,确保高可用、低延迟的通信体验。用户可轻松创建和管理智能体及实时工作流,实现高效对话,并可通过示例网站体验功能。