百度大脑首次发布AI硬件:「蓄谋已久」向终端发力

简介: 在不断开发新技术、推动人工智能服务的同时,百度大脑也推出了自己的硬件。本周三,百度在深圳一口气发布了 12 个计算板卡、硬件平台等产品。如此「硬核」的发布会开了整整两个小时。

百度在发布会上推出了视觉计算卡、多款视觉分析模组、语音开发套件等硬件,甚至还有一套硬件评测与认证服务。其中,百度和赛灵思、英特尔等厂商合作推出的板卡引人注目。这些硬件面向端侧设备,可帮助开发者快速设计出自己的产品。


「此前,百度大脑的技术很多是以 SDK 的方式推出的,」百度 AI 技术生态部总经理喻友平表示,「但还有更多的场景,如安防和物联网设备非常依赖新型硬件才能实现 AI 的真正落地。」这是自 2016 年百度大脑启动开放以来,首次集中发布硬件平台与产品。


目前人工智能的应用主要集中于计算机视觉和自然语言识别领域,这也是此次百度发布硬件产品的两大方向。


视觉计算模块 EasyEdge


「AI 的应用过程很长,对于开发者来说,要设计高性能、低功耗的深度学习模型,搭配高效率的硬件,再结合实际场景才能最终成功。」喻友平介绍道。百度希望通过自己的产品来解决大部分环节中的难点。


百度大脑首先推出的是基于 Paddle Mobile 打造的「零代码」端计算模型生成平台 EasyEdge。与之相配的是两款 AI 加速计算卡。


39E39014-026E-49AA-945B-8B30D00D8EDE.jpeg


第一款是主打小型化、低功耗的 X-eye 计算卡,其只有一元硬币大小,支持人脸识别、手势、商品识别等多种高性能视觉算法,搭载 Intel Movdius AI 加速芯片,算力超过 1Tops。同时,这块计算卡还带有百度独创的 Xos 加速技术,可使神经网络算法平均提速 15%,核心模型如人脸识别算法则可以提升 200%。这款计算卡可灵活搭配多种视觉模组,形成完整的解决方案。


96A45971-2964-400F-89D6-121A32BB592B.jpeg


针对需求较高的任务,百度推出了适用于大计算量、可自定制模型的 EdgeBoard 计算卡。EdgeBoard 的解决方案中包含模型嵌入工具包、AI 加速工具包、嵌入式计算卡参考设计,其软硬一体的完整架构可为端侧人工智能负载提供强大算力。在芯片上,百度选择了赛灵思的 FPGA,可提供 2.4Tops 的 AI 算力,性能 3 倍于终端 GPU、10 倍于终端 CPU。百度称,EdgeBoard 在运行 Resnet50 模型推断任务时可达到 55FPS 的处理速度。


深度学习模型通过集成 EdgeBoard 可大大提升推断任务时的性能表现,解决终端算力发展相对不足与低延迟需求之间的矛盾。


为了展示计算卡的实力,百度与合作伙伴们共同打造了两款人脸识别抓拍一体机。据百度介绍,这些设备可以实现 98% 的人脸识别准确率,适用于营业厅、便利店等场景,可帮助店铺快速完成智能化改造。


百度表示,EasyEdge 支持 4 种深度学习框架、13 种神经网络结构,适配 5 款芯片与 3 种操作系统。。该产品允许用户在没有人工智能应用开发能力的情况下通过可视化操作进行深度学习模型的开发。针对不同的场景,EasyEdge 的用户只需 3 步、最快 2 分钟即可生成端计算模型 SDK,可节省 90% 的开发时间,并兼顾性能与能耗,可大大降低端计算模型的开发成本。


百度远场语音开发套件


在语音识别方面,百度打算将智能音箱上最为重要的远场识别麦克风阵列的软硬件技术开放出来,供所有厂商使用。


「我清晰地记得在 2017 年,百度曾预测大量科技公司都会发力远场麦克风阵列。」百度语音技术部产品与架构负责人谢延在发布会上表示,「去年智能音箱领域的发展印证了我们的预测。今天 DuerOS 激活数量超过 2 亿,和百度大脑的语音识别技术进步是分不开的。」


百度在发布会上介绍了近期的一些技术突破,包括一次唤醒多次交互技术,以及刚刚推出的 SMLTA 模型。其中,流式截断多层注意力建模(SMLTA)方法可将在线语音识别精度提升 15%,是全球首次实现的基于 Attention 技术的在线语音识别服务,已大规模部署在了百度输入法中。现在,人们在手机上就可以获得人工智能带来的高精度语音识别体验了。


百度认为,在远场语音识别时代开发者有四个需要重点注意的地方:信号处理、软硬结合、端到端(在 AI 建模上)以及唤醒技术(整词的唤醒词进行建模)。为了方便更多公司开发属于自己的产品,百度发布了远场语音开发套件。


502182B9-0295-44BA-B6BB-684D5CE25523.jpeg

百度远场语音端到端解决方案从用户交互端到云端识别模型全链条定制,解决了远场语音交互识别不稳定、错误率高等应用问题。


新发布的开发套件使用安卓系统,搭载了远场语音端到端技术,其硬件可以选择高性能或高性价比的两种板卡,麦克风阵列则有三种:包括环形 6+1 麦、线形 4 麦和车载 3 麦的多形态麦克风阵列套件方案。百度远场语音开发套件基于端到端方案,按照最佳技术实践指导生产,可解决语音交互产品研发过程中无可用设备选型、选型调试成本大、调试效果不佳等问题。该方案支持回声消除、声源定位、波束形成、噪声抑制等处理算法。百度称,目前使用这些套件落地的产品已达 150 余款。


「百度的远场语音开发套件自 2017 年就开始研发了,直到今天才发布了公版。」谢延表示。百度也在做自己的 DSP 解决方案,以期进一步降低硬件成本,降低门槛。


认证 AI 硬件


在硬件之外,百度大脑还发布了一些针对 AI 硬件的服务,包括硬件端云协同技术及评测认证。或许在未来,想知道一种硬件是否适用于人工智能应用,得看它有没有通过百度的评测了?


百度大脑新推出的硬件评测认证是国内首个 AI 硬件评测认证体系。百度为 AI 技术周边的硬件产品如传感器、计算卡等进行标准化的评测和认证。例如,百度会评测摄像头输出的图像质量是否符合场景需求、图像和算法是否匹配等等。百度认为,通过评测和认证机制可以减轻厂商在集成产品过程中选型、评测的成本及工作量,帮助 AI 硬件产品标准化。


91D3E0CA-5247-4F16-BE82-DFFECAE93322.jpeg


硬件的接入与售卖是百度大脑 AI 硬件生态的最后一环。「从端侧硬件的数据采集到整个项目的系统集成,在常规情况下需要冗长的对接开发工作。」喻友平表示,针对这一痛点,百度大脑推出了硬件接入与端云协同平台 EdgeCloud,该平台连接 AI 端硬件与 AI 云服务,提供设备管理、数据管理等功能。百度称,使用该平台的用户无需任何代码就可以完成端到端的项目集成。这种形式有效降低了硬件接入与系统集成开发门槛。


63175AA4-2571-433A-B49D-A36B1FCC2C68.jpeg


目前,百度大脑已有 100 多家硬件生态伙伴,百度大脑的 AI 能力已有超过 150 项能力开放,社区内聚集了超过 80 万开发者,而行业应用的方向达到了 20 个。从模型开发到硬件产品,百度大脑已经形成了完整的人工智能产品链。


现在百度大脑硬件已经有 100 家以上的合作伙伴。



本文为机器之心报道,转载请联系本公众号获得授权

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
3月前
|
人工智能 运维 安全
基于合合信息开源智能终端工具—Chaterm的实战指南【当运维遇上AI,一场效率革命正在发生】
在云计算和多平台运维日益复杂的今天,传统命令行工具正面临前所未有的挑战。工程师不仅要记忆成百上千条操作命令,还需在不同平台之间切换终端、脚本、权限和语法,操作效率与安全性常常难以兼顾。尤其在多云环境、远程办公、跨部门协作频繁的背景下,这些“低效、碎片化、易出错”的传统运维方式,已经严重阻碍了 IT 团队的创新能力和响应速度。 而就在这时,一款由合合信息推出的新型智能终端工具——Chaterm,正在悄然颠覆这一现状。它不仅是一款跨平台终端工具,更是业内率先引入 AI Agent 能力 的“会思考”的云资源管理助手。
|
3月前
|
人工智能 IDE 开发工具
2.4k star 开源项目,Wingman AI + 知识图谱,如何帮你搭建‘私人大脑’?学术/项目必备,让笔记真正活起来!
MindForger 是一款灵感源于人脑思维机制的桌面 Markdown IDE,帮助用户构建私人知识体系。它通过强大的语义联想与结构重构功能,解决笔记混乱、缺乏智能联接等痛点。核心功能包括 TAYR/TAYW 联想、知识图谱浏览器、Markdown 编辑器和 AI 助手 Wingman。支持本地隐私保护,跨平台使用,开源 GPLv2 许可。项目地址:https://github.com/dvorka/mindforger。
101 4
|
2月前
|
人工智能 运维 自然语言处理
电力+AI,「国网云智」重构电网运维的"超级大脑"
在深夜,当城市楼宇渐入梦乡时,在国网信通公司云运营中心还有一批运维工程师默默守护着大家微弱的灯光、此起彼伏的沟通声、咔咔的键盘敲击声响彻着每个工位。 当某系统的异常警报亮起时,工程师迅速利用「国网云智」定位问题,屏幕上即刻弹出详尽的排查方案及解决方案;而另一侧的监控员框选闪烁的告警区域,系统已自动锁定故障点,并在生成检修方案上标注了对应的工具清单和操作优先级。
174 0
|
2月前
|
存储 人工智能 自然语言处理
无影AgentBay来了!给AI智能体装上“超级大脑”
阿里云在WAIC上发布专为AI Agents打造的“超级大脑”——无影AgentBay。该云端电脑支持多系统切换,集成视觉理解、自然语言控制等多项AI能力,提供高性能算力与企业级安全保障,助力AI开发者高效构建智能应用。
130 0
无影AgentBay来了!给AI智能体装上“超级大脑”
|
2月前
|
人工智能 PyTorch 区块链
当AI遇上区块链,会不会搞出一个“去中心化大脑”?
当AI遇上区块链,会不会搞出一个“去中心化大脑”?
83 9
|
2月前
|
人工智能 文字识别 供应链
高校实验实训课程开发:基于现有的硬件基础和开源能力研发最前沿的AI实验课程
更多基于学校现有硬件基础:企业需求场景的开发和发展,更加注重上层数据和应用,各类工具软件的出现,极大提升了各类硬件的应用价值。我们看到各类硬件厂商,想方设法把硬件卖给学校,但是很多硬件不是在那里尘封,就是寥寥无几的使用场景,我们希望基于学校现有的硬件基础去开发更多面向不同行业或专业的实验实训课程,物尽其用。基于学校现有的硬件,集约开发,极大降低硬件投入成本。
103 7
|
2月前
|
存储 网络协议 人工智能
我在网上看到了一篇关于将智能AI、脑机接口接入到大脑的文章之后大发灵感,我现在写写我自己的版本
本项目设想一种脑机接口系统,结合阿里云操作系统与量子意识技术,实现用户通过心灵感应与AI交互、下载知识、远程医疗等操作。系统分为侵入式与非侵入式设备,支持意识上网、意念输入、跨物种通讯等功能,并构建“全宇宙意识互联网”架构,实现与传统网络的数据互通,探索未来人机交互与通信新形态。
|
3月前
|
人工智能 自然语言处理 运维
AI agent跨平台云资源智能管理终端是什么
随着多云架构和混合IT环境的普及,企业面临跨平台资源协同效率低、操作复杂等问题。为此,跨平台云资源智能管理终端应运而生。它通过模块化架构与自动化引擎,将异构云环境中的资源统一管理,并提供对话式交互、批量操作与智能策略编排能力。典型产品如Chaterm,支持自然语言指令输入,实现从任务规划到执行反馈的闭环体验。其应用场景涵盖大规模服务器集群管理、跨云资源调度、复杂环境自动化配置等,显著提升效率与可靠性。实施时需关注兼容性、扩展性及安全性,建议从试点入手逐步推广,优化企业运维流程。
150 5
|
3月前
|
人工智能 安全 物联网
释放终端潜能----端侧AI模型
端侧AI将智能直接部署于终端设备,实现毫秒级响应、极致隐私保护与显著成本优化。其核心优势包括极速响应(告别网络延迟)、隐私安全(数据不出本地)及成本优化(减少云端依赖)。通过模型小型化、硬件感知优化、高效推理引擎和端云协同等关键技术,端侧AI在有限资源下保持高性能,
324 0
释放终端潜能----端侧AI模型

热门文章

最新文章