「镁客·请讲」云知声黄伟:从云到端再到芯片,一步步打造“云端芯”生态闭环

简介:

对于黄伟和云知声来讲,今年是让AI芯片UniOne经受市场考验的一年,也是进一步扩大业务的一年。

去年,智能音箱以及智能家居的盛行让语音交互再次走上一个高峰,同时,作为人工智能的重要一环,AI芯片也得到了广大的关注。现在,云知声将两者进行了一次融合,为自己的定位扣上了最后一环。

云知声黄伟:从云到端再到芯片,一步步打造“云端芯”生态闭环

创立云知声,只因人机自然对话是接下来的变革

在创立云知声之前,创始人兼CEO黄伟实际上一直都与语音有着密切的联系。在摩托罗拉期间,他曾主导开发全球第一款手机声纹认证系统。任职盛大创新院核心高管期间,创建了语音分院。

我相信,以语音识别为代表的自然人机对话技术在接下来会给我们的生活带来很多变革。我们在2012年创立云知声,那时候大家谈的更多的是语音识别等等,而我们要做的不仅仅是语音识别,是人工智能最基础的一些工作。”黄伟说到。

在成立之初,云知声基于云端用语音识别等技术为人们提供智能化服务,不过,“我们发现不能只依赖云,它虽然很重要,但是要实现技术落地的话,往往还需要与终端设备和芯片紧密联合。”也因此,云知声在2013年年底确立了自己的定位——打造“云端芯”生态闭环

在内部,云知声一直专注于打磨自己的AI核心能力,并时刻清醒的认知到“有多大的能力揽多大的事情”;而在外部,企业一直关注着市场的动态,比如某个领域的具备需求,且这个需求是不是真的达到了一个临界点等等。基于这两点,当前的云知声已经阶段性的在教育、医疗、车载设备、智能家居等多个领域获得了不错的成果。

因为相关智能硬件设备的出现,越来越多的人开始使用语音交互。不过,我们同时也注意到,相比于B端市场,语音交互技术在C端市场的渗透率似乎并没有那么的高,或者说,更多的消费者还没有适应或者习惯使用语音交互这一人机交互方式

对此,黄伟指出了原因,“无论是安卓手机还是苹果手机,它都是以触控为主的。就这个场景中,语音并不是一个刚性需求,因为用户用手指头就能做到的事情没必要通过声音来做。” 再细化一点,其中的关键在于设备的形态、识别理解技术的达标以及第三方服务的整合,找到一个适合语音交互落地的设备,基于准确率高的智能语音交互技术为用户提供日常必需第三方应用服务。“当这三个要素都具备的话,那么我相信人机语音交互一定会越来越普及。”黄伟表示。

云知声黄伟:从云到端再到芯片,一步步打造“云端芯”生态闭环

早早建立AI芯片研发团队,综合发挥算力和算法的最大优势

当前,在云服务和设备终端方面,云知声的实力已经得到了市场的认可,其生态闭环的最后一环“芯”——智能语音专用芯片“UniOne”面临市场考验的时候也快到了。

去年,“AI芯片”绝对是人工智能行业的关键词之一。与寒武纪等AI芯片公司一样,云知声也早早的开始了AI芯片的研发。

以2015年为分水岭,在此之前,云知声的策略是将自己的算法融入别人家的芯片,“一开始提出‘云端芯’的时候,其中的‘芯’并不是指单一芯片,而是一组芯片模组。”黄伟表示。因此,彼时的云知声只是选择诸如高通等厂家的通用芯片,继而将自己的算法融入进去,让其具备ASR等AI能力。

云知声黄伟:从云到端再到芯片,一步步打造“云端芯”生态闭环

因为第一阶段的成功,云知声更确定了芯片端的战略定位。于是在2015年,其组建了一个新的团队以研发自己的AI芯片。“这样的话,我们可以把计算能力和算法能力非常完美的结合在一起,综合发挥算力和算法的最大优势。”黄伟称。

去年6月,云知声还只是在语音中控解决方案Pandora的发布会上透露了有关AI芯片UniOne的相关计划,而就在此次采访的过程中,黄伟向镁客网记者透露,当所有人开始意识到“芯片”是人工智能落地关键的时候,云知声已经完成了自研AI芯片UniOne的流片。不否认,在得知这个消息的时候,我们是意外的。

另外,他也透露,AI芯片UniOne将在今年上半年正式发布

这是我们对整个行业趋势中一些关键路径和关键节点的判断,在这一波AI芯片的热潮中,我觉得我们应该是占据了一定领先优势的。”黄伟说到。

去年,人工智能领域内开始意识到AI芯片的重要性,包括云知声在内等多家公司都有所成果。而对于AI芯片在2018年的表现,黄伟认为,AI芯片在今年的市场并不会出现很大的数量。

为什么?“芯片是一个高度集成的产业,它自身存在一个周期,所以我觉得AI芯片可能会在今年年终的时候才会开始陆续进入市场。”黄伟表示。“在硬件设备端,芯片需要一定周期的测量,所以今年整个的市场规模在盈利方面不会特别大,或者说占据绝对主导性,但在明年一定会。”

云知声黄伟:从云到端再到芯片,一步步打造“云端芯”生态闭环

激进与谨慎是标签,今年的目标是紧握优势进一步扩大业务

人工智能基本上分为几大类,一类是图像的智能,一类是声音和文本的智能,我们已经做了三分之二——声音加文本的智能化。”对于云知声6年多来的成果,黄伟这样说到。

同时,他也为云知声贴上了两个标签,分别是激进与谨慎所谓的“激进”更多指代的是“前瞻性的眼光”,譬如在2013年对AI芯片的趋势预判,这是他眼中看来一个企业CEO必须具备的能力。

至于谨慎,则是时刻根据自身的能力与市场的发展情况来适当调整自己的节奏,追求最后的结果而不是一时的风光。

用黄伟的话来说,云知声就是这样,基于“云端芯”战略一步一步走来的,从云到端,再到芯片模组和自己的芯片,一步一步完成“云端芯”生态闭环。

在很多人看来,2018年该是AI企业交出成果的一年。而对于今年要实现的目标,黄伟称,这一年来是智能语音行业的一个分水岭,只有那些能够保持技术原创和不断更新,并把技术做成产品往商业上去推广、真正实现落地的公司,会进入一个加速状态,而云知声就处于这样一个状态。

“从去年开始,我们在机器人、车载设备、智能家居、医疗等方面都处于国内遥遥领先的状态,在2018年,云知声毫无疑问要继续把握我们的领先优势,包括时间窗口、技术、产品体系完善度和执行力,将整个公司的业务进一步扩大。”

最后

创业是一件很难的事情,这个心态首先要把握好,不能被外界事物所干扰,这是非常重要的。”在采访的最后,作为一个创业老兵,黄伟向我们讲述了一些“经验”。

除了心态,他也提到,在创业之初要给公司一个相对较新的定位,因为所有的资源分配和所有的方向制定都是根据定位来走的,哪怕之后一直调整,也代表了一种思考与进步。

此外,作为一家从事人工智能方向的公司,技术和市场二者必需拥有一个,如此才能在与友商PK的时候获得一定的优势,并获得弥补短处的时间。


原文发布时间: 2018-03-22 10:48
本文作者: 韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
网络协议 Unix Shell
FreeBSD的特点是什么?如何使用?
【10月更文挑战第29天】FreeBSD的特点是什么?如何使用?
527 2
|
12月前
|
人工智能 程序员 测试技术
全网招募 100 位 AI 程序员体验官,感受 DeepSeek 加持下智能编码
通义灵码联合阿里云开发者社区,全网寻找 100 位 AI 程序员体验官,感受 AI 程序员和满血版 Deepseek 加持下的智能编码新功能,体验需求开发、跨语言编程、单元测试自动生成、图生代码等 AI 程序员能力,领取 Cherry 机械键盘、智能手环等奖品。
|
弹性计算 缓存 数据挖掘
阿里云服务器经济型e和通用算力型u1实例区别及选择参考
在阿里云目前的活动中,经济型e和通用算力型u1实例是两个比较热门的云服务器实例规格,收费标准相对其他计算型、通用型和内存型实例来说要更低一些,经济型e实例ECS云服务器2核2G3M带宽新购和续费都是99元1年,通用算力型u1实例2核4G5M带宽新购和续费都只要199元1年、4核8G云服务器955.58元1年。有的新手用户并不清楚他们之间的区别及如何选择,本文将介绍阿里云服务器中的经济型e实例和通用算力型u1实例的特点、区别以及新手选择参考。
|
数据可视化
混淆矩阵的生成
混淆矩阵的生成
|
SQL Java 数据库
5、Mybatis-Plus 常用注解
这篇文章详细介绍了Mybatis-Plus中常用的注解,包括解决实体类与数据库表名不一致、字段不匹配的问题,主键生成策略的配置,以及逻辑删除的实现方法。
5、Mybatis-Plus 常用注解
|
存储 安全 关系型数据库
MySQL中使用percona-xtrabackup工具 三种备份及恢复 (超详细教程)
MySQL中使用percona-xtrabackup工具 三种备份及恢复 (超详细教程)
1431 1
|
存储 机器学习/深度学习 自然语言处理
Mini but Mighty | 简直就是微调ViT神器,有了Mimi微调方法,别的不用选了!又稳又快!
Mini but Mighty | 简直就是微调ViT神器,有了Mimi微调方法,别的不用选了!又稳又快!
755 1
|
云安全 安全 开发工具
权威认证|瓴羊荣获ISO27001与ISO27018安全合规认证
权威认证|瓴羊荣获ISO27001与ISO27018安全合规认证
353 0
|
缓存 前端开发 API
淘宝拍立淘iOS相册架构设计小结
推荐语:这篇文章从系统权限、API 调用、架构设计等角度,生动演示了一个设计友好、模块独立、易拓展以及用户体验优秀的相册是如何开发出来的。除此之外,作者针对各种小细节也做了优化和解析,使得功能实现更加的丰满。文章整体读下来,可以让读者对于相册的设计和开发有深刻的印象,具备极大的指导意义,推荐阅读! ——大淘宝技术终端开发工程师 隽弦
472 0
淘宝拍立淘iOS相册架构设计小结
|
Ubuntu 前端开发 JavaScript
前端破圈Win11系统下安装使用Ubuntu子系统🏴‍☠️
前端破圈Win11系统下安装使用Ubuntu子系统🏴‍☠️
563 0

热门文章

最新文章