百度大脑首次发布AI硬件:「蓄谋已久」向终端发力

简介: 在不断开发新技术、推动人工智能服务的同时,百度大脑也推出了自己的硬件。本周三,百度在深圳一口气发布了 12 个计算板卡、硬件平台等产品。如此「硬核」的发布会开了整整两个小时。

百度在发布会上推出了视觉计算卡、多款视觉分析模组、语音开发套件等硬件,甚至还有一套硬件评测与认证服务。其中,百度和赛灵思、英特尔等厂商合作推出的板卡引人注目。这些硬件面向端侧设备,可帮助开发者快速设计出自己的产品。


「此前,百度大脑的技术很多是以 SDK 的方式推出的,」百度 AI 技术生态部总经理喻友平表示,「但还有更多的场景,如安防和物联网设备非常依赖新型硬件才能实现 AI 的真正落地。」这是自 2016 年百度大脑启动开放以来,首次集中发布硬件平台与产品。


目前人工智能的应用主要集中于计算机视觉和自然语言识别领域,这也是此次百度发布硬件产品的两大方向。


视觉计算模块 EasyEdge


「AI 的应用过程很长,对于开发者来说,要设计高性能、低功耗的深度学习模型,搭配高效率的硬件,再结合实际场景才能最终成功。」喻友平介绍道。百度希望通过自己的产品来解决大部分环节中的难点。


百度大脑首先推出的是基于 Paddle Mobile 打造的「零代码」端计算模型生成平台 EasyEdge。与之相配的是两款 AI 加速计算卡。


39E39014-026E-49AA-945B-8B30D00D8EDE.jpeg


第一款是主打小型化、低功耗的 X-eye 计算卡,其只有一元硬币大小,支持人脸识别、手势、商品识别等多种高性能视觉算法,搭载 Intel Movdius AI 加速芯片,算力超过 1Tops。同时,这块计算卡还带有百度独创的 Xos 加速技术,可使神经网络算法平均提速 15%,核心模型如人脸识别算法则可以提升 200%。这款计算卡可灵活搭配多种视觉模组,形成完整的解决方案。


96A45971-2964-400F-89D6-121A32BB592B.jpeg


针对需求较高的任务,百度推出了适用于大计算量、可自定制模型的 EdgeBoard 计算卡。EdgeBoard 的解决方案中包含模型嵌入工具包、AI 加速工具包、嵌入式计算卡参考设计,其软硬一体的完整架构可为端侧人工智能负载提供强大算力。在芯片上,百度选择了赛灵思的 FPGA,可提供 2.4Tops 的 AI 算力,性能 3 倍于终端 GPU、10 倍于终端 CPU。百度称,EdgeBoard 在运行 Resnet50 模型推断任务时可达到 55FPS 的处理速度。


深度学习模型通过集成 EdgeBoard 可大大提升推断任务时的性能表现,解决终端算力发展相对不足与低延迟需求之间的矛盾。


为了展示计算卡的实力,百度与合作伙伴们共同打造了两款人脸识别抓拍一体机。据百度介绍,这些设备可以实现 98% 的人脸识别准确率,适用于营业厅、便利店等场景,可帮助店铺快速完成智能化改造。


百度表示,EasyEdge 支持 4 种深度学习框架、13 种神经网络结构,适配 5 款芯片与 3 种操作系统。。该产品允许用户在没有人工智能应用开发能力的情况下通过可视化操作进行深度学习模型的开发。针对不同的场景,EasyEdge 的用户只需 3 步、最快 2 分钟即可生成端计算模型 SDK,可节省 90% 的开发时间,并兼顾性能与能耗,可大大降低端计算模型的开发成本。


百度远场语音开发套件


在语音识别方面,百度打算将智能音箱上最为重要的远场识别麦克风阵列的软硬件技术开放出来,供所有厂商使用。


「我清晰地记得在 2017 年,百度曾预测大量科技公司都会发力远场麦克风阵列。」百度语音技术部产品与架构负责人谢延在发布会上表示,「去年智能音箱领域的发展印证了我们的预测。今天 DuerOS 激活数量超过 2 亿,和百度大脑的语音识别技术进步是分不开的。」


百度在发布会上介绍了近期的一些技术突破,包括一次唤醒多次交互技术,以及刚刚推出的 SMLTA 模型。其中,流式截断多层注意力建模(SMLTA)方法可将在线语音识别精度提升 15%,是全球首次实现的基于 Attention 技术的在线语音识别服务,已大规模部署在了百度输入法中。现在,人们在手机上就可以获得人工智能带来的高精度语音识别体验了。


百度认为,在远场语音识别时代开发者有四个需要重点注意的地方:信号处理、软硬结合、端到端(在 AI 建模上)以及唤醒技术(整词的唤醒词进行建模)。为了方便更多公司开发属于自己的产品,百度发布了远场语音开发套件。


502182B9-0295-44BA-B6BB-684D5CE25523.jpeg

百度远场语音端到端解决方案从用户交互端到云端识别模型全链条定制,解决了远场语音交互识别不稳定、错误率高等应用问题。


新发布的开发套件使用安卓系统,搭载了远场语音端到端技术,其硬件可以选择高性能或高性价比的两种板卡,麦克风阵列则有三种:包括环形 6+1 麦、线形 4 麦和车载 3 麦的多形态麦克风阵列套件方案。百度远场语音开发套件基于端到端方案,按照最佳技术实践指导生产,可解决语音交互产品研发过程中无可用设备选型、选型调试成本大、调试效果不佳等问题。该方案支持回声消除、声源定位、波束形成、噪声抑制等处理算法。百度称,目前使用这些套件落地的产品已达 150 余款。


「百度的远场语音开发套件自 2017 年就开始研发了,直到今天才发布了公版。」谢延表示。百度也在做自己的 DSP 解决方案,以期进一步降低硬件成本,降低门槛。


认证 AI 硬件


在硬件之外,百度大脑还发布了一些针对 AI 硬件的服务,包括硬件端云协同技术及评测认证。或许在未来,想知道一种硬件是否适用于人工智能应用,得看它有没有通过百度的评测了?


百度大脑新推出的硬件评测认证是国内首个 AI 硬件评测认证体系。百度为 AI 技术周边的硬件产品如传感器、计算卡等进行标准化的评测和认证。例如,百度会评测摄像头输出的图像质量是否符合场景需求、图像和算法是否匹配等等。百度认为,通过评测和认证机制可以减轻厂商在集成产品过程中选型、评测的成本及工作量,帮助 AI 硬件产品标准化。


91D3E0CA-5247-4F16-BE82-DFFECAE93322.jpeg


硬件的接入与售卖是百度大脑 AI 硬件生态的最后一环。「从端侧硬件的数据采集到整个项目的系统集成,在常规情况下需要冗长的对接开发工作。」喻友平表示,针对这一痛点,百度大脑推出了硬件接入与端云协同平台 EdgeCloud,该平台连接 AI 端硬件与 AI 云服务,提供设备管理、数据管理等功能。百度称,使用该平台的用户无需任何代码就可以完成端到端的项目集成。这种形式有效降低了硬件接入与系统集成开发门槛。


63175AA4-2571-433A-B49D-A36B1FCC2C68.jpeg


目前,百度大脑已有 100 多家硬件生态伙伴,百度大脑的 AI 能力已有超过 150 项能力开放,社区内聚集了超过 80 万开发者,而行业应用的方向达到了 20 个。从模型开发到硬件产品,百度大脑已经形成了完整的人工智能产品链。


现在百度大脑硬件已经有 100 家以上的合作伙伴。



本文为机器之心报道,转载请联系本公众号获得授权

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
1月前
|
机器学习/深度学习 人工智能 UED
为何NPU是开启终端侧生成式AI的关键?
【2月更文挑战第17天】为何NPU是开启终端侧生成式AI的关键?
35 2
为何NPU是开启终端侧生成式AI的关键?
|
30天前
|
人工智能 编解码 数据安全/隐私保护
才发现百度自带的AI图片助手这么好用,去水印、画质优化、AI扩图、涂抹消除等功能一应俱全!
才发现百度自带的AI图片助手这么好用,去水印、画质优化、AI扩图、涂抹消除等功能一应俱全!
156 0
|
1月前
|
人工智能 自动驾驶 安全
破壁人AI百度:科技公司反内卷的典型样本
破壁人AI百度:科技公司反内卷的典型样本
14 0
|
1月前
|
人工智能 自动驾驶 安全
破壁人AI百度:科技公司反内卷的典型样本
简介: 互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。
破壁人AI百度:科技公司反内卷的典型样本
|
1月前
|
人工智能
阿里数赛首次向AI开放!
【2月更文挑战第24天】阿里数赛首次向AI开放!
20 1
阿里数赛首次向AI开放!
|
1月前
|
人工智能 搜索推荐 机器人
AI Agent涌向移动终端,手机智能体开启跨端跨应用业务连接新场景
AI Agent涌向移动终端,开启跨端跨应用业务连接新场景,手机智能体将成企业AIGC应用新标配。
42 0
|
2月前
|
人工智能 数据可视化 算法
苹果Vision Pro携Sora引领AI的新浪潮,XR硬件未来探索之旅
苹果Vision pro刚刚发布,一跃成为迄今最先进的虚拟现实和增强现实眼镜,苹果公司将其称为“空间计算机”。 OpenAI的创始人兼首席执行官山姆·奥特曼评价:苹果Vision pro是自iPhone以后第二惊艳的技术。实际上手体验时,当你带上眼睛后,沉浸式呈现眼前是一个虚拟空间,它以高分辨率屏幕,支持重放事件和人物的三维视频录像,看起来就像置身其中,只需要通过简单的眼神和隔空手势操作。
|
2月前
|
人工智能 自然语言处理 计算机视觉
TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
【2月更文挑战第3天】TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
42 1
TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
|
2月前
|
人工智能 Cloud Native 搜索推荐
金融先锋联盟发布17份联合解决方案,首次聚焦AI应用场景探索
金融先锋联盟发布17份联合解决方案,首次聚焦AI应用场景探索
67 0
|
3月前
|
人工智能 数据安全/隐私保护 芯片
AI日报:大型律师事务所首次推出人工智能工具撰写合同
AI日报:大型律师事务所首次推出人工智能工具撰写合同
49 0