中国Alexa款款而来,蓦然认知获AI交互领域2016最大量级A轮融资

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介:

北京蓦然认知科技有限公司(又名:小蓦机器人)近日传来喜讯,已获得来自顶级投资机构经纬中国、源码、襄禾的1000万美金的A轮投资,顺利突破资本寒冬;而这也是2016年国内AI交互领域里最大量级的一笔A轮融资。此外,蓦然认知已成为多家智能设备生厂商在智能家居领域的对话及语义技术提供商,并与国内最大的数字地图生产商四维图新在智能车载市场达成战略合作关系。

中国Alexa款款而来,蓦然认知获AI交互领域2016最大量级A轮融资

蓦然认知(Moran)成立于2016年5月,是一家以认知计算、自然语言理解技术为核心的人工智能公司,主要对外提供信号处理、语音、语义、云端服务等自动对接的一站式智能交互解决方案。其团队研发的智能决策交互引擎“小蓦机器人”(Mor)主要面向 B 端客户,主打语音交互和决策,垂直应用于智能车载、智能家居、智能客服三大领域。

蓦然认知CEO戴帅湘表示,“人类智能的最大体现是对于语言的理解和学习,人类不需要阅读浩瀚的书海才能认知世界,只需要最基本的读图写字能力就能探索世界;这种功能同样需要为机器所学习——用少量的数据就能掌握非常多的知识。”而智能语音交互产品最难突破的技术瓶颈,就在于对人类语言的理解上。戴帅湘表示,蓦然认知在NLP领域具有三大核心技术:自然语音交互、自动服务对接、知识表示及推理;并且在这三方面取得了重大突破,这也使小蓦机器人在语义理解、多轮对话、上下文理解以及场景间的自由切换的能力非常突出,甚至在生活高频垂类场景中的能力要比Alexa以及Google Now的表现更出色。

在智能语音交互方面,微软近期提出了一个新的统计指标——CPS,即人类与人工智能“聊天机器人”的对话轮数。据微软统计显示,目前小冰的CPS是23左右,而Siri、Google Now 等以智能助手为目的开发的人工智能引擎,CPS往往都不超过3。

中国Alexa款款而来,蓦然认知获AI交互领域2016最大量级A轮融资

蓦然认知的工程师正在测试小蓦机器人在连续对话中的响应速度


微软这里的CPS,主要指的是用户与聊天类机器人所能维持“单轮对话”的平均次数。而对于语音助手类交互引擎来说,真正有效的“多轮对话”并不只是简单 “单轮对话”的叠加,而是要求交互引擎必须在单轮对话的基础上做到上下文理解,能清晰识别出用户在上文,乃至更远的上上文中所提到的场景和关键词,从而理解当前用户口中的“这里”、“那里”、“他”等指代词的具体含义,进而才能实现趋近于人类口语的多轮对话,帮助用户完成决策。从这个更为严格的标准来看,微软的CPS并不具备实用性和参考性。

 蓦然认知从语言处理的底层开始逐级向上依次提出了语义理解、多轮对话、增强学习的三位一体自然语言交互模型。相比微软的小冰和小娜、苹果的Siri、谷歌的Google Now、安卓的灵犀、百度的度秘等交互引擎,小蓦机器人最大的优势就在于上下文关联的多轮对话,并且具有快速的场景移植性。

小蓦机器人通过不断与用户交流,能自动识别其偏好,根据用户不可预测的对话进行不停的构建和调整,做到像人类一样仅用少量的常识和数据,就能自我学习到非常多的知识。从而达到真正意义上的人机多轮对话。

据悉,小蓦机器人目前已能做到30种以上日常生活领域中的语义理解,并在小时级或天级的速度来完成新场景的识别和理解。这主要基于蓦然认知创造了一套完整的常识知识表示机制,并在此基础上构建了强大的推理模型;可以针对服务及其相关背景知识做复杂的语义分析。而目前市面上绝大多数的交互引擎,都无法达到小蓦机器人的多场景语义迁移能力。

此外,蓦然认知开发的自动服务对接程序可以扫描服务商提供的接口,让其尽可能自动化地接入到对话模型中,以“可拔插”的方式来满足对话过程中特定的意图和需求。目前小蓦机器人后台已成功对接了团购信息、FM、出租车、天气、机票、火车票、视频、宾馆、微信等30多个垂直领域的服务。

成员构架方面,蓦然认知在注重于专业技术对口的同时,也保留了相当程度的多元国际化视野。其成员有多位来自于BAT的高级技术专家和多年叱咤硅谷的NLP高新技术人才;也有常年征战于海外,具备国际化视野的管理人;及具拥有丰富创业公司运营和知识产权及专利申请维护经验的法务人员等。

关于本轮融资,CEO戴帅湘表示将会主要用于研发的投入和商业的拓展。他表示,“让机器认知世界”是一项任重而道远的任务,我们还有很多的技术难点需要攻破。对于以技术为核心竞争力的蓦然认知而言,攻破NLP领域的难点是戴帅湘和他的团队坚持不懈的方向。不过他也表示越来越多的B端客户以及广大的C端用户都迫不及待的期待AI助手能够尽快的走进日常生活。各大家居、车载的设备商都纷纷把产品AI化作为公司的重要战略发展方向,而蓦然认知的智能交互决策系统Mor可以作为AI操作系统植入不同的设备中,让每一个硬件设备都具有与用户对话的能力,并支持复杂的决策。之前Facebook的CEO扎克伯格提到,他在建立自己的smart home 过程中,遇到最大的挑战是每个设备都有不同的AI系统,每个智能设备都是孤立的。戴帅湘表示,Mor具有多设备迁移的能力,用户可以在客厅与电视对话后, 走进厨房继续上述的话题与冰箱对话,甚至,随后走出家门,进入车里都可以继续之前话题,只要这几个设备都植入了Mor简单的SDK即可。

另外,为了更好的满足B端客户的个性化需求,蓦然认知也会提供一个mor.ai的开放平台,让更多的开发者参与配置和开发。戴帅湘表示,他非常期待科幻片中的多设备关联的智能助手能够尽快都进我们的现实生活。

对于这次投资,经纬中国合伙人王华东表示,“蓦然认知科技在自然语言处理领域的见地令我们印象深刻。这种深刻不止体现在技术上,也体现在创始人对应用场景的理解上。很多技术型公司在产品化的过程中会过分发挥“想象力”,主观罗列他们的技术可以解决的问题——通常情况下会是一个长列表,还会强调每个场景的商业潜力都很大。而蓦然认知科技在这方面现实得多,技术强大但没有炫技的成分,我们热切期待他们成为自然语言处理领域的领导者。”

在2017于1月美国赌城拉斯维加斯举办的CES展上,亚马逊的Alexa无疑成为了智能语音交互领域的最大赢家,智能语音交互已是国内外科技界的最大热点产业之一。在这一环境下,国内智能语音厂商如雨后春笋般冒出,但投资大环境的趋冷却无可避免地加速了智能语音行业的淘汰进程。

可以看出蓦然认知得以顺利突破产业寒冬,其自身突出的技术优势带来的商业竞争力,以及立体而稳定的团队构架是其得到投资方的垂青的两大最主要因素。蓦然认知团队能否最终能成为国际舞台上自然语言处理领域的领导者?让我们拭目以待吧。

本文作者:咲甜

本文转自雷锋网禁止二次转载,原文链接

相关文章
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
39 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
10天前
|
数据采集 人工智能 自然语言处理
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
Midscene.js 是一款基于 AI 技术的 UI 自动化测试框架,通过自然语言交互简化测试流程,支持动作执行、数据查询和页面断言,提供可视化报告,适用于多种应用场景。
109 1
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
|
23天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
132 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
22天前
|
人工智能 自然语言处理 API
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
谷歌推出的Multimodal Live API是一个支持多模态交互、低延迟实时互动的AI接口,能够处理文本、音频和视频输入,提供自然流畅的对话体验,适用于多种应用场景。
69 3
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
|
1月前
|
人工智能 自然语言处理 前端开发
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
Lobe Vidol是一款开源的AI数字人交互平台,允许用户创建和互动自己的虚拟偶像。该平台提供流畅的对话体验、丰富的动作姿势库、优雅的用户界面设计以及多种技术支持,如文本到语音和语音到文本技术。Lobe Vidol适用于娱乐互动、在线教育、客户服务、品牌营销和社交媒体等多个应用场景。
106 7
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
|
10天前
|
人工智能 API 数据库
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
Browser Use 是一款专为大语言模型设计的智能浏览器工具,支持多标签页管理、视觉识别、内容提取等功能,并能记录和重复执行特定动作,适用于多种应用场景。
148 0
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
|
2月前
|
人工智能 Shell iOS开发
AI Shell:在命令行里“对话” AI ,微软推出将 AI 助手引入命令行的 CLI 工具,打造对话式交互命令行
AI Shell 是一款强大的 CLI 工具,将人工智能直接集成到命令行中,帮助用户提高生产力。AI Shell 支持多种 AI 模型和助手,通过多代理框架提供丰富的功能和灵活的使用模式。
162 7
|
3月前
|
人工智能 缓存 Java
深入解析Spring AI框架:在Java应用中实现智能化交互的关键
【10月更文挑战第12天】Spring AI 是 Spring 框架家族的新成员,旨在满足 Java 应用程序对人工智能集成的需求。它支持自然语言处理、图像识别等多种 AI 技术,并提供与云服务(如 OpenAI、Azure Cognitive Services)及本地模型的无缝集成。通过简单的配置和编码,开发者可轻松实现 AI 功能,同时应对模型切换、数据安全及性能优化等挑战。
249 3
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
未来智能交互:AI技术的进展与应用展望
随着人工智能(AI)技术的迅猛发展,智能交互系统正逐步成为日常生活和工作中不可或缺的一部分。本文探讨了AI技术在智能交互领域的最新进展,以及未来可能的应用前景,涵盖了语音识别、自然语言处理和智能助理等关键技术的演进与应用案例。 【7月更文挑战第3天】
536 0
|
7月前
|
人工智能 搜索推荐 算法
未来智能交互:AI技术在日常生活中的应用与挑战
随着人工智能(AI)技术的迅速发展,智能交互已经深刻影响了我们的日常生活。本文探讨了AI技术在各个领域的应用现状以及未来可能面临的挑战,从语音助手到智能家居,再到个性化推荐系统,AI正在如何重塑我们与科技互动的方式。