百度大脑首次发布AI硬件:「蓄谋已久」向终端发力

简介: 在不断开发新技术、推动人工智能服务的同时,百度大脑也推出了自己的硬件。本周三,百度在深圳一口气发布了 12 个计算板卡、硬件平台等产品。如此「硬核」的发布会开了整整两个小时。

百度在发布会上推出了视觉计算卡、多款视觉分析模组、语音开发套件等硬件,甚至还有一套硬件评测与认证服务。其中,百度和赛灵思、英特尔等厂商合作推出的板卡引人注目。这些硬件面向端侧设备,可帮助开发者快速设计出自己的产品。


「此前,百度大脑的技术很多是以 SDK 的方式推出的,」百度 AI 技术生态部总经理喻友平表示,「但还有更多的场景,如安防和物联网设备非常依赖新型硬件才能实现 AI 的真正落地。」这是自 2016 年百度大脑启动开放以来,首次集中发布硬件平台与产品。


目前人工智能的应用主要集中于计算机视觉和自然语言识别领域,这也是此次百度发布硬件产品的两大方向。


视觉计算模块 EasyEdge


「AI 的应用过程很长,对于开发者来说,要设计高性能、低功耗的深度学习模型,搭配高效率的硬件,再结合实际场景才能最终成功。」喻友平介绍道。百度希望通过自己的产品来解决大部分环节中的难点。


百度大脑首先推出的是基于 Paddle Mobile 打造的「零代码」端计算模型生成平台 EasyEdge。与之相配的是两款 AI 加速计算卡。


39E39014-026E-49AA-945B-8B30D00D8EDE.jpeg


第一款是主打小型化、低功耗的 X-eye 计算卡,其只有一元硬币大小,支持人脸识别、手势、商品识别等多种高性能视觉算法,搭载 Intel Movdius AI 加速芯片,算力超过 1Tops。同时,这块计算卡还带有百度独创的 Xos 加速技术,可使神经网络算法平均提速 15%,核心模型如人脸识别算法则可以提升 200%。这款计算卡可灵活搭配多种视觉模组,形成完整的解决方案。


96A45971-2964-400F-89D6-121A32BB592B.jpeg


针对需求较高的任务,百度推出了适用于大计算量、可自定制模型的 EdgeBoard 计算卡。EdgeBoard 的解决方案中包含模型嵌入工具包、AI 加速工具包、嵌入式计算卡参考设计,其软硬一体的完整架构可为端侧人工智能负载提供强大算力。在芯片上,百度选择了赛灵思的 FPGA,可提供 2.4Tops 的 AI 算力,性能 3 倍于终端 GPU、10 倍于终端 CPU。百度称,EdgeBoard 在运行 Resnet50 模型推断任务时可达到 55FPS 的处理速度。


深度学习模型通过集成 EdgeBoard 可大大提升推断任务时的性能表现,解决终端算力发展相对不足与低延迟需求之间的矛盾。


为了展示计算卡的实力,百度与合作伙伴们共同打造了两款人脸识别抓拍一体机。据百度介绍,这些设备可以实现 98% 的人脸识别准确率,适用于营业厅、便利店等场景,可帮助店铺快速完成智能化改造。


百度表示,EasyEdge 支持 4 种深度学习框架、13 种神经网络结构,适配 5 款芯片与 3 种操作系统。。该产品允许用户在没有人工智能应用开发能力的情况下通过可视化操作进行深度学习模型的开发。针对不同的场景,EasyEdge 的用户只需 3 步、最快 2 分钟即可生成端计算模型 SDK,可节省 90% 的开发时间,并兼顾性能与能耗,可大大降低端计算模型的开发成本。


百度远场语音开发套件


在语音识别方面,百度打算将智能音箱上最为重要的远场识别麦克风阵列的软硬件技术开放出来,供所有厂商使用。


「我清晰地记得在 2017 年,百度曾预测大量科技公司都会发力远场麦克风阵列。」百度语音技术部产品与架构负责人谢延在发布会上表示,「去年智能音箱领域的发展印证了我们的预测。今天 DuerOS 激活数量超过 2 亿,和百度大脑的语音识别技术进步是分不开的。」


百度在发布会上介绍了近期的一些技术突破,包括一次唤醒多次交互技术,以及刚刚推出的 SMLTA 模型。其中,流式截断多层注意力建模(SMLTA)方法可将在线语音识别精度提升 15%,是全球首次实现的基于 Attention 技术的在线语音识别服务,已大规模部署在了百度输入法中。现在,人们在手机上就可以获得人工智能带来的高精度语音识别体验了。


百度认为,在远场语音识别时代开发者有四个需要重点注意的地方:信号处理、软硬结合、端到端(在 AI 建模上)以及唤醒技术(整词的唤醒词进行建模)。为了方便更多公司开发属于自己的产品,百度发布了远场语音开发套件。


502182B9-0295-44BA-B6BB-684D5CE25523.jpeg

百度远场语音端到端解决方案从用户交互端到云端识别模型全链条定制,解决了远场语音交互识别不稳定、错误率高等应用问题。


新发布的开发套件使用安卓系统,搭载了远场语音端到端技术,其硬件可以选择高性能或高性价比的两种板卡,麦克风阵列则有三种:包括环形 6+1 麦、线形 4 麦和车载 3 麦的多形态麦克风阵列套件方案。百度远场语音开发套件基于端到端方案,按照最佳技术实践指导生产,可解决语音交互产品研发过程中无可用设备选型、选型调试成本大、调试效果不佳等问题。该方案支持回声消除、声源定位、波束形成、噪声抑制等处理算法。百度称,目前使用这些套件落地的产品已达 150 余款。


「百度的远场语音开发套件自 2017 年就开始研发了,直到今天才发布了公版。」谢延表示。百度也在做自己的 DSP 解决方案,以期进一步降低硬件成本,降低门槛。


认证 AI 硬件


在硬件之外,百度大脑还发布了一些针对 AI 硬件的服务,包括硬件端云协同技术及评测认证。或许在未来,想知道一种硬件是否适用于人工智能应用,得看它有没有通过百度的评测了?


百度大脑新推出的硬件评测认证是国内首个 AI 硬件评测认证体系。百度为 AI 技术周边的硬件产品如传感器、计算卡等进行标准化的评测和认证。例如,百度会评测摄像头输出的图像质量是否符合场景需求、图像和算法是否匹配等等。百度认为,通过评测和认证机制可以减轻厂商在集成产品过程中选型、评测的成本及工作量,帮助 AI 硬件产品标准化。


91D3E0CA-5247-4F16-BE82-DFFECAE93322.jpeg


硬件的接入与售卖是百度大脑 AI 硬件生态的最后一环。「从端侧硬件的数据采集到整个项目的系统集成,在常规情况下需要冗长的对接开发工作。」喻友平表示,针对这一痛点,百度大脑推出了硬件接入与端云协同平台 EdgeCloud,该平台连接 AI 端硬件与 AI 云服务,提供设备管理、数据管理等功能。百度称,使用该平台的用户无需任何代码就可以完成端到端的项目集成。这种形式有效降低了硬件接入与系统集成开发门槛。


63175AA4-2571-433A-B49D-A36B1FCC2C68.jpeg


目前,百度大脑已有 100 多家硬件生态伙伴,百度大脑的 AI 能力已有超过 150 项能力开放,社区内聚集了超过 80 万开发者,而行业应用的方向达到了 20 个。从模型开发到硬件产品,百度大脑已经形成了完整的人工智能产品链。


现在百度大脑硬件已经有 100 家以上的合作伙伴。



本文为机器之心报道,转载请联系本公众号获得授权

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
3月前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【8月更文挑战第1天】在当今科技飞速发展的时代,AI已成为日常生活中不可或缺的一部分。神经网络作为AI的核心,通过模拟人脑中的神经元连接方式处理复杂数据模式。利用Python及其强大的库TensorFlow,我们可以轻松构建神经网络模型。示例代码展示了如何建立一个含有两层隐藏层的简单神经网络,用于分类任务。神经网络通过反向传播算法不断优化权重和偏置,从而提高预测准确性。随着技术的进步,神经网络正变得越来越深、越来越复杂,能够应对更加艰巨的挑战,推动着AI领域向前发展。
50 2
|
23天前
|
传感器 人工智能 机器人
|
16天前
|
人工智能 搜索推荐 机器人
AI+硬件最新资讯合集(2024-11-11第3期)
近期出现让大模型具备控制电脑和手机能力的智能体,掀起 “Computer Use Agents” 热潮。
|
27天前
|
人工智能 分布式计算 数据可视化
大模型私有化部署全攻略:硬件需求、数据隐私、可解释性与维护成本挑战及解决方案详解,附示例代码助你轻松实现企业内部AI应用
【10月更文挑战第23天】随着人工智能技术的发展,企业越来越关注大模型的私有化部署。本文详细探讨了硬件资源需求、数据隐私保护、模型可解释性、模型更新和维护等方面的挑战及解决方案,并提供了示例代码,帮助企业高效、安全地实现大模型的内部部署。
67 1
|
27天前
|
人工智能 分布式计算 数据可视化
大模型私有化部署全攻略:硬件需求、数据隐私、可解释性与维护成本挑战及解决方案详解,附示例代码助你轻松实现企业内部AI应用
【10月更文挑战第23天】随着人工智能技术的发展,大模型在各领域的应用日益广泛。然而,将其私有化部署到企业内部面临诸多挑战,如硬件资源需求高、数据隐私保护、模型可解释性差、更新维护成本高等。本文探讨了这些挑战,并提出了优化硬件配置、数据加密、可视化工具、自动化更新机制等解决方案,帮助企业顺利实现大模型的私有化部署。
59 1
|
1月前
|
人工智能 机器人 中间件
AI+硬件最新资讯合集(2024-10-28第1期)
AI与硬件的结合正逐步改变我们的生活方式,本期合集将带您了解AI+硬件的最新动态:
|
1月前
|
机器学习/深度学习 人工智能 算法
Nature子刊:AI模型测大脑年龄,究竟哪些因素会加速大脑衰老?
【10月更文挑战第7天】《自然医学》杂志近期发布了一项研究,介绍了一种名为BrainAge的人工智能模型,该模型可预测个体的大脑年龄并分析影响大脑衰老的因素。研究团队来自美国加州大学旧金山分校,利用英国生物银行的近50,000名参与者的数据,发现高血压、糖尿病、肥胖、吸烟、饮酒、缺乏运动及遗传因素均与大脑衰老有关。尽管存在数据集限制等局限性,BrainAge模型仍为研究大脑衰老和相关疾病提供了重要工具。
51 1
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【9月更文挑战第12天】在当今科技飞速发展的时代,人工智能(AI)已深入我们的生活,从智能助手到自动驾驶,从医疗诊断到金融分析,其力量无处不在。这一切的核心是神经网络。本文将带领您搭乘Python的航船,深入AI的大脑,揭秘智能背后的秘密神经元。通过构建神经网络模型,我们可以模拟并学习复杂的数据模式。以下是一个使用Python和TensorFlow搭建的基本神经网络示例,用于解决简单的分类问题。
49 10
|
5月前
|
人工智能 算法 定位技术
[AI aider] 打造终端AI搭档:Aider让编程更智能更有趣!
发现Aider,一个能在终端中与AI搭档编程的工具,让你的编程体验更智能、更有趣。
[AI aider] 打造终端AI搭档:Aider让编程更智能更有趣!
|
4月前
|
人工智能 搜索推荐 vr&ar
苹果手机iOS18最新升级:植入AI人工智能,国内百度文心一言,国外GPT4o来辅助
iOS 18亮点速览:AI强化的Siri、RCS安卓消息兼容、自定义主屏、辅助功能增强,VR进步,新隐私工具,包括锁定APP和眼动追踪。Passwords app保障安全,Apple Intelligence提升个性化体验。
216 1
下一篇
无影云桌面