10月18日上午,以“AI元力,重启未来”为主题的AI World 2019 世界人工智能峰会在中国北京中关村展示中心成功举办。峰会由海淀区政府、中关村科学城管委会主办,新智元、海淀园管委会、智源研究院承办。
在这次峰会上,科大讯飞轮值总裁胡郁做了题为《未来,因A.I.而能》的演讲。老冀注意到,最近几年科大讯飞除了持续投入机器阅读理解、自动驾驶、语音识别等AI相关领域的技术研发之外,也正在打造AIoT的生态系统。
胡郁表示:“每一个公司都有自己的人工智能、大数据、云计算,彼此正交的不同公司需要并能够建立紧密的合作。在新的生态下,知识、经验、数据、利益的分享变得更加重要,通过混合的方式建立新生态下的共赢合作是成功的关键。”
在老冀看来,科大讯飞正在以智能语音相关的AI技术作为核心,打造完整的AIoT生态系统。2018年,科大讯飞推出了基于云端的智能语音云端操作系统iFLYOS的新版本——iFLYOS 2.0。
此前发布的iFLYOS 1.0版本已经提供了超过200个技能,还联手腾讯音乐娱乐集团、喜马拉雅在内的100余家内容服务合作方为用户提供相关服务。
iFLYOS 2.0在开放度上有了进一步的提升:除了直接使用iFLYOS用户体系,企业级开发者还可以选择使用自己的用户体系;利用技能工作室,开发者可以集成自己的各种服务,实现自定义语义服务;在唤醒词、发音人、GUI等方面,开发者都能将自己的品牌元素融合,从而让开发者完全能在iFLYOS的基础上开发一个属于自己的智能硬件操作系统。
2018 年,科大讯飞还发布了人机交互界面 AIUI 3.0,并与iFLYOS 2.0融合为一体,打造出以语音为主要交互形式,以智能硬件为载体,融合云端与终端的AI Agent(智能物联网操作系统)。
要知道,AI技术的分支其实有很多,分别涉及图像、语音、文本等领域。任何一家AI技术公司,要成功地实现规模商业化,关键还是要跨越从早期尝鲜者到实用型用户的巨大鸿沟。而根据研究机构Gartner的报告,语音识别有望成为最早走向成熟的AI技术。
过去,科大讯飞在2B领域特别是教育行业的产业化上做得比较成功;这些年来,科大讯飞也开始涉足2C领域,先后推出了讯飞翻译机3.0、讯飞转写机、讯飞智能录音笔、讯飞智能办公本、讯飞学习机等智能硬件产品。
正如科大讯飞所规划的那样,任何一家企业要想在AIoT上取得成功,需要做好“铁人三项”:
1. 硬件:智能硬件
2. 服务:建立自有的人工智能服务系统
3. 分发渠道:消费者通过AI Agent获得服务
说到底,关键还是要建立智能语音的生态系统。不过,正因为智能语音市场正在走向成熟,还有亚马逊Alexa智能语音生态系统可供借鉴,国内众多科技公司也纷纷开始打造以自己为中心的生态。从目前来看,小米、阿里巴巴、百度都是以智能音箱作为硬件和用户入口,以自己的智能语音开放平台作为载体,通过给众多开发者赋能,力图打造完整的生态系统。
以小米为例,截止到今年6月 30 日,小爱智能音箱出货量超过 400 万台,小爱同学月活超过 4990 万,45%的智能音箱用户使用语音来控制他们的 IoT 设备。
就在前不久,国际语音识别领域的大牛、语音识别开源工具Kaldi之父 Daniel Povey 在 Twitter 上宣布,他与小米马上要达成一个协议,将会在今年底动身来北京,并且会雇佣一个小团队来打造新一代的语音识别开源工具。
看来,这场关于智能语音的大战还刚刚开始,谁能够率先建立起更完善的生态系统,谁就更有可能在广阔的AIoT战场占得先机。