在昨天下午举行的论坛中,百度副总裁、百度 AI 技术与平台体系(AIG)总负责人王海峰在开场致辞中表示,百度在人工智能领域深耕多年,从十七年前百度诞生之日起就开始积累,几乎所有主要人工智能技术都已在百度搜索引擎中得到应用,来自搜索引擎的用户需求、数据和平台,支撑了百度 AI 技术的快速发展,现在百度人工智能在算法、数据、技术等方面具有领先优势。
「在每天数十亿次用户请求的千锤百炼下,百度的人工智能技术已是真正实用的人工智能技术。」王海峰认为,人工智能的技术还在不断进步,但另一方面,只有将技术与实际应用相结合,根据用户需求和反馈反复迭代优化,才能打造强大、更具活力的 AI 技术。
作为一家大型科技公司,百度诞生于 PC 互联网时代,那是一个开放生态的时代。百度认为,在互联网的助力下得到迅速发展的 AI 技术,也应该秉承开放精神。更重要的是,AI 的影响将不限于互联网,AI 将影响各行各业和人们生活的方方面面。百度希望通过与开发者和社会共享 AI 技术成果,带动生态繁荣,推动社会进步。
在大会上,百度宣布其多年打造的完整 AI 技术平台将全面开放。百度的 AI 能力分为四层。在基础层,是 AI 算法、大数据、大计算能力。在感知层,包括语音、图像、视频、AR/VR 等技术。认知层有自然语言处理、知识图谱及用户画像等。在平台层,基础层、感知层、认知层的技术会平台化,通过百度 AI 开放平台 ai.baidu.com 开放,与开发者共享。截至目前,百度 AI 开放平台上开放的技术共有 60 个,已成为最全面的 AI 技术开放平台。
开放技术打造完整平台
百度正试图通过开放的生态体系在人工智能的时代引领发展的潮流。此次宣布开放的语音、自然语言处理、视频、增强现实、机器人视觉等技术,与已经开放的 AI 技术一起,构成具有 60 项开放技术的完整的、综合的 AI 开放平台,为开发者提供形式多样、可定制、可组合的 AI 技术,满足开发者从 API、源码、数据到计算能力的多层次需求。
在自动驾驶的精细数据集中,每一帧的图片要几个小时才能完全标注,百度第一次开放了 3000 帧用于自动驾驶的全标注数据集,并计划在今年 9 月开放更多。
作为中国科技巨头中第一个选择转型的企业,百度在 AI 技术上具有先发优势,完整布局和深厚技术积累。百度的 AI 技术始终随着公司业务的发展而不断进化,由于庞大的用户规模和强大的人才积累,百度 AI 技术的开放对于开发者们来说是一个好消息。在大会上,百度表示,其 AI 开放平台多项技术的使用量过去半年都有 2 倍以上的增长。
唤醒万物:语音技术+自然语言处理
语音交互或许是人机交互的下一个风口,随着亚马逊 Alexa 等智能设备的兴起,语音技术的需求正日益增加。百度语音技术部总监高亮在分论坛现场介绍了本次新开放的远场识别及语音唤醒、定制化语音合成、语音合成音色、情感语音交互(Emotional CUI)等技术。通过这些开源的技术,开发者们可以实现不同场景的智能应用,轻松设计出满足自己需求的产品。
在利用语音技术,让机器理解用户所指之后,更重要的是能让机器懂得用户真正的需求,这就需要用到自然语言处理技术。在分论坛中,百度自然语言处理部总监赵世奇详细介绍了语言理解与交互技术平台——UNIT。该平台将开放语言理解技术、交互技术,从百度大数据中自动汲取最有价值的数据提供给开发者使用,为开发者提供了多种定制化方案,还首创「训练师」模式,助力开发者训练对话机器人,赋予机器「理解」自然语言,听懂用户需求,以及与用户进行多轮次对话的能力。
看懂世界:视频分析、人脸识别和 AR
在论坛中,百度研究院院长林元庆介绍了视频分析与理解、机器人视觉和人脸识别等技术。同时,本次开发者大会还发布了全面的视频语义理解技术,包括视频封面选摘、视频分类、视频比对、细粒度识别、视频审核、视频公众人物识别、视频结构化分析等。此外,林元庆还介绍了用于自动驾驶机器学习训练的语义分割 RGBD 视频数据集,以及完整的机器人视觉解决方案。
增强现实(AR)技术作为全新的视觉交互形式,越来越受到营销、娱乐、游戏等行业关注。百度增强现实实验室主任吴中勤现场发布全新 DuMix AR 开放平台,为开发者供 AR SDK、内容制作工具、云端内容平台和内容分发服务。吴中勤表示,未来百度将提供更多场景的 AR 行业解决方案,赋能各行各业,共同探索 AR 价值。
在 AI 技术与开放平台分论坛上,除了发布新开放的核心技术能力,百度也表示将对已有技术进行改革。百度杰出科学家徐伟批露了 PaddlePaddle 的最新发展路径图,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。作为国内首个开源深度学习平台,百度在 PaddlePaddle 的研发中持完全开放的态度,试图与开发者们共同推进技术的发展。「在重新设计之后,今年 9 月我们将推出全新版本的 PaddlePaddle,」徐伟表示。「在简化代码,运行更加高效的基础上,它将对移动端和嵌入式设备有更加完善的支持。」
而在计划于 2017 年 12 月推出的新版本中,PaddlePaddle 将支持英伟达全新 Volta 架构的 16 位浮点运算,并加入 TensorRT 的支持。
Create 2017 开发者大会上备受瞩目的 AI 技术与开放平台分论坛,是整合了 NLP、KG、IDL、语音、大数据等核心技术部门的百度 AI 技术平台体系 AIG 成立后的首次集体亮相,全面展示了百度的 AI 技术能力。可以想象,未来随着百度 AI 技术的进一步开放,开发者、创业者、业内公司将不断从中受益,让人工智能技术赋能更多场景,创造更多价值;而另一方面,百度也会从这些行动中不断提升自己的竞争力。无论如何,这次开源行动必将推动国内人工智能领域的加速发展。
相关链接
- 开放/开源计划:http://ai.baidu.com/
- Apollo GitHub:https://github.com/apolloauto
本文为机器之心原创,转载请联系本公众号获得授权。