百度大脑首次发布AI硬件：「蓄谋已久」向终端发力-阿里云开发者社区

百度大脑首次发布AI硬件：「蓄谋已久」向终端发力

2021-11-30 356

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在不断开发新技术、推动人工智能服务的同时，百度大脑也推出了自己的硬件。本周三，百度在深圳一口气发布了 12 个计算板卡、硬件平台等产品。如此「硬核」的发布会开了整整两个小时。

百度在发布会上推出了视觉计算卡、多款视觉分析模组、语音开发套件等硬件，甚至还有一套硬件评测与认证服务。其中，百度和赛灵思、英特尔等厂商合作推出的板卡引人注目。这些硬件面向端侧设备，可帮助开发者快速设计出自己的产品。

「此前，百度大脑的技术很多是以 SDK 的方式推出的，」百度 AI 技术生态部总经理喻友平表示，「但还有更多的场景，如安防和物联网设备非常依赖新型硬件才能实现 AI 的真正落地。」这是自 2016 年百度大脑启动开放以来，首次集中发布硬件平台与产品。

目前人工智能的应用主要集中于计算机视觉和自然语言识别领域，这也是此次百度发布硬件产品的两大方向。

视觉计算模块 EasyEdge

「AI 的应用过程很长，对于开发者来说，要设计高性能、低功耗的深度学习模型，搭配高效率的硬件，再结合实际场景才能最终成功。」喻友平介绍道。百度希望通过自己的产品来解决大部分环节中的难点。

百度大脑首先推出的是基于 Paddle Mobile 打造的「零代码」端计算模型生成平台 EasyEdge。与之相配的是两款 AI 加速计算卡。

第一款是主打小型化、低功耗的 X-eye 计算卡，其只有一元硬币大小，支持人脸识别、手势、商品识别等多种高性能视觉算法，搭载 Intel Movdius AI 加速芯片，算力超过 1Tops。同时，这块计算卡还带有百度独创的 Xos 加速技术，可使神经网络算法平均提速 15%，核心模型如人脸识别算法则可以提升 200%。这款计算卡可灵活搭配多种视觉模组，形成完整的解决方案。

针对需求较高的任务，百度推出了适用于大计算量、可自定制模型的 EdgeBoard 计算卡。EdgeBoard 的解决方案中包含模型嵌入工具包、AI 加速工具包、嵌入式计算卡参考设计，其软硬一体的完整架构可为端侧人工智能负载提供强大算力。在芯片上，百度选择了赛灵思的 FPGA，可提供 2.4Tops 的 AI 算力，性能 3 倍于终端 GPU、10 倍于终端 CPU。百度称，EdgeBoard 在运行 Resnet50 模型推断任务时可达到 55FPS 的处理速度。

深度学习模型通过集成 EdgeBoard 可大大提升推断任务时的性能表现，解决终端算力发展相对不足与低延迟需求之间的矛盾。

为了展示计算卡的实力，百度与合作伙伴们共同打造了两款人脸识别抓拍一体机。据百度介绍，这些设备可以实现 98% 的人脸识别准确率，适用于营业厅、便利店等场景，可帮助店铺快速完成智能化改造。

百度表示，EasyEdge 支持 4 种深度学习框架、13 种神经网络结构，适配 5 款芯片与 3 种操作系统。。该产品允许用户在没有人工智能应用开发能力的情况下通过可视化操作进行深度学习模型的开发。针对不同的场景，EasyEdge 的用户只需 3 步、最快 2 分钟即可生成端计算模型 SDK，可节省 90% 的开发时间，并兼顾性能与能耗，可大大降低端计算模型的开发成本。

百度远场语音开发套件

在语音识别方面，百度打算将智能音箱上最为重要的远场识别麦克风阵列的软硬件技术开放出来，供所有厂商使用。

「我清晰地记得在 2017 年，百度曾预测大量科技公司都会发力远场麦克风阵列。」百度语音技术部产品与架构负责人谢延在发布会上表示，「去年智能音箱领域的发展印证了我们的预测。今天 DuerOS 激活数量超过 2 亿，和百度大脑的语音识别技术进步是分不开的。」

百度在发布会上介绍了近期的一些技术突破，包括一次唤醒多次交互技术，以及刚刚推出的 SMLTA 模型。其中，流式截断多层注意力建模（SMLTA）方法可将在线语音识别精度提升 15%，是全球首次实现的基于 Attention 技术的在线语音识别服务，已大规模部署在了百度输入法中。现在，人们在手机上就可以获得人工智能带来的高精度语音识别体验了。

百度认为，在远场语音识别时代开发者有四个需要重点注意的地方：信号处理、软硬结合、端到端（在 AI 建模上）以及唤醒技术（整词的唤醒词进行建模）。为了方便更多公司开发属于自己的产品，百度发布了远场语音开发套件。

百度远场语音端到端解决方案从用户交互端到云端识别模型全链条定制，解决了远场语音交互识别不稳定、错误率高等应用问题。

新发布的开发套件使用安卓系统，搭载了远场语音端到端技术，其硬件可以选择高性能或高性价比的两种板卡，麦克风阵列则有三种：包括环形 6+1 麦、线形 4 麦和车载 3 麦的多形态麦克风阵列套件方案。百度远场语音开发套件基于端到端方案，按照最佳技术实践指导生产，可解决语音交互产品研发过程中无可用设备选型、选型调试成本大、调试效果不佳等问题。该方案支持回声消除、声源定位、波束形成、噪声抑制等处理算法。百度称，目前使用这些套件落地的产品已达 150 余款。

「百度的远场语音开发套件自 2017 年就开始研发了，直到今天才发布了公版。」谢延表示。百度也在做自己的 DSP 解决方案，以期进一步降低硬件成本，降低门槛。

认证 AI 硬件

在硬件之外，百度大脑还发布了一些针对 AI 硬件的服务，包括硬件端云协同技术及评测认证。或许在未来，想知道一种硬件是否适用于人工智能应用，得看它有没有通过百度的评测了？

百度大脑新推出的硬件评测认证是国内首个 AI 硬件评测认证体系。百度为 AI 技术周边的硬件产品如传感器、计算卡等进行标准化的评测和认证。例如，百度会评测摄像头输出的图像质量是否符合场景需求、图像和算法是否匹配等等。百度认为，通过评测和认证机制可以减轻厂商在集成产品过程中选型、评测的成本及工作量，帮助 AI 硬件产品标准化。

硬件的接入与售卖是百度大脑 AI 硬件生态的最后一环。「从端侧硬件的数据采集到整个项目的系统集成，在常规情况下需要冗长的对接开发工作。」喻友平表示，针对这一痛点，百度大脑推出了硬件接入与端云协同平台 EdgeCloud，该平台连接 AI 端硬件与 AI 云服务，提供设备管理、数据管理等功能。百度称，使用该平台的用户无需任何代码就可以完成端到端的项目集成。这种形式有效降低了硬件接入与系统集成开发门槛。