百度大脑首次发布AI硬件:「蓄谋已久」向终端发力

简介: 在不断开发新技术、推动人工智能服务的同时,百度大脑也推出了自己的硬件。本周三,百度在深圳一口气发布了 12 个计算板卡、硬件平台等产品。如此「硬核」的发布会开了整整两个小时。

百度在发布会上推出了视觉计算卡、多款视觉分析模组、语音开发套件等硬件,甚至还有一套硬件评测与认证服务。其中,百度和赛灵思、英特尔等厂商合作推出的板卡引人注目。这些硬件面向端侧设备,可帮助开发者快速设计出自己的产品。


「此前,百度大脑的技术很多是以 SDK 的方式推出的,」百度 AI 技术生态部总经理喻友平表示,「但还有更多的场景,如安防和物联网设备非常依赖新型硬件才能实现 AI 的真正落地。」这是自 2016 年百度大脑启动开放以来,首次集中发布硬件平台与产品。


目前人工智能的应用主要集中于计算机视觉和自然语言识别领域,这也是此次百度发布硬件产品的两大方向。


视觉计算模块 EasyEdge


「AI 的应用过程很长,对于开发者来说,要设计高性能、低功耗的深度学习模型,搭配高效率的硬件,再结合实际场景才能最终成功。」喻友平介绍道。百度希望通过自己的产品来解决大部分环节中的难点。


百度大脑首先推出的是基于 Paddle Mobile 打造的「零代码」端计算模型生成平台 EasyEdge。与之相配的是两款 AI 加速计算卡。


39E39014-026E-49AA-945B-8B30D00D8EDE.jpeg


第一款是主打小型化、低功耗的 X-eye 计算卡,其只有一元硬币大小,支持人脸识别、手势、商品识别等多种高性能视觉算法,搭载 Intel Movdius AI 加速芯片,算力超过 1Tops。同时,这块计算卡还带有百度独创的 Xos 加速技术,可使神经网络算法平均提速 15%,核心模型如人脸识别算法则可以提升 200%。这款计算卡可灵活搭配多种视觉模组,形成完整的解决方案。


96A45971-2964-400F-89D6-121A32BB592B.jpeg


针对需求较高的任务,百度推出了适用于大计算量、可自定制模型的 EdgeBoard 计算卡。EdgeBoard 的解决方案中包含模型嵌入工具包、AI 加速工具包、嵌入式计算卡参考设计,其软硬一体的完整架构可为端侧人工智能负载提供强大算力。在芯片上,百度选择了赛灵思的 FPGA,可提供 2.4Tops 的 AI 算力,性能 3 倍于终端 GPU、10 倍于终端 CPU。百度称,EdgeBoard 在运行 Resnet50 模型推断任务时可达到 55FPS 的处理速度。


深度学习模型通过集成 EdgeBoard 可大大提升推断任务时的性能表现,解决终端算力发展相对不足与低延迟需求之间的矛盾。


为了展示计算卡的实力,百度与合作伙伴们共同打造了两款人脸识别抓拍一体机。据百度介绍,这些设备可以实现 98% 的人脸识别准确率,适用于营业厅、便利店等场景,可帮助店铺快速完成智能化改造。


百度表示,EasyEdge 支持 4 种深度学习框架、13 种神经网络结构,适配 5 款芯片与 3 种操作系统。。该产品允许用户在没有人工智能应用开发能力的情况下通过可视化操作进行深度学习模型的开发。针对不同的场景,EasyEdge 的用户只需 3 步、最快 2 分钟即可生成端计算模型 SDK,可节省 90% 的开发时间,并兼顾性能与能耗,可大大降低端计算模型的开发成本。


百度远场语音开发套件


在语音识别方面,百度打算将智能音箱上最为重要的远场识别麦克风阵列的软硬件技术开放出来,供所有厂商使用。


「我清晰地记得在 2017 年,百度曾预测大量科技公司都会发力远场麦克风阵列。」百度语音技术部产品与架构负责人谢延在发布会上表示,「去年智能音箱领域的发展印证了我们的预测。今天 DuerOS 激活数量超过 2 亿,和百度大脑的语音识别技术进步是分不开的。」


百度在发布会上介绍了近期的一些技术突破,包括一次唤醒多次交互技术,以及刚刚推出的 SMLTA 模型。其中,流式截断多层注意力建模(SMLTA)方法可将在线语音识别精度提升 15%,是全球首次实现的基于 Attention 技术的在线语音识别服务,已大规模部署在了百度输入法中。现在,人们在手机上就可以获得人工智能带来的高精度语音识别体验了。


百度认为,在远场语音识别时代开发者有四个需要重点注意的地方:信号处理、软硬结合、端到端(在 AI 建模上)以及唤醒技术(整词的唤醒词进行建模)。为了方便更多公司开发属于自己的产品,百度发布了远场语音开发套件。


502182B9-0295-44BA-B6BB-684D5CE25523.jpeg

百度远场语音端到端解决方案从用户交互端到云端识别模型全链条定制,解决了远场语音交互识别不稳定、错误率高等应用问题。


新发布的开发套件使用安卓系统,搭载了远场语音端到端技术,其硬件可以选择高性能或高性价比的两种板卡,麦克风阵列则有三种:包括环形 6+1 麦、线形 4 麦和车载 3 麦的多形态麦克风阵列套件方案。百度远场语音开发套件基于端到端方案,按照最佳技术实践指导生产,可解决语音交互产品研发过程中无可用设备选型、选型调试成本大、调试效果不佳等问题。该方案支持回声消除、声源定位、波束形成、噪声抑制等处理算法。百度称,目前使用这些套件落地的产品已达 150 余款。


「百度的远场语音开发套件自 2017 年就开始研发了,直到今天才发布了公版。」谢延表示。百度也在做自己的 DSP 解决方案,以期进一步降低硬件成本,降低门槛。


认证 AI 硬件


在硬件之外,百度大脑还发布了一些针对 AI 硬件的服务,包括硬件端云协同技术及评测认证。或许在未来,想知道一种硬件是否适用于人工智能应用,得看它有没有通过百度的评测了?


百度大脑新推出的硬件评测认证是国内首个 AI 硬件评测认证体系。百度为 AI 技术周边的硬件产品如传感器、计算卡等进行标准化的评测和认证。例如,百度会评测摄像头输出的图像质量是否符合场景需求、图像和算法是否匹配等等。百度认为,通过评测和认证机制可以减轻厂商在集成产品过程中选型、评测的成本及工作量,帮助 AI 硬件产品标准化。


91D3E0CA-5247-4F16-BE82-DFFECAE93322.jpeg


硬件的接入与售卖是百度大脑 AI 硬件生态的最后一环。「从端侧硬件的数据采集到整个项目的系统集成,在常规情况下需要冗长的对接开发工作。」喻友平表示,针对这一痛点,百度大脑推出了硬件接入与端云协同平台 EdgeCloud,该平台连接 AI 端硬件与 AI 云服务,提供设备管理、数据管理等功能。百度称,使用该平台的用户无需任何代码就可以完成端到端的项目集成。这种形式有效降低了硬件接入与系统集成开发门槛。


63175AA4-2571-433A-B49D-A36B1FCC2C68.jpeg


目前,百度大脑已有 100 多家硬件生态伙伴,百度大脑的 AI 能力已有超过 150 项能力开放,社区内聚集了超过 80 万开发者,而行业应用的方向达到了 20 个。从模型开发到硬件产品,百度大脑已经形成了完整的人工智能产品链。


现在百度大脑硬件已经有 100 家以上的合作伙伴。



本文为机器之心报道,转载请联系本公众号获得授权

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
2天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
95 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
|
4天前
|
人工智能 搜索推荐 开发工具
24.7K Star!用 KHOJ 打造你的AI第二大脑,自动整合和更新多源知识,轻松构建个人知识库
KHOJ 是一款开源的个人化 AI 助手,支持多源知识整合、语义搜索、个性化图像生成等功能,帮助用户高效管理知识库。
74 23
24.7K Star!用 KHOJ 打造你的AI第二大脑,自动整合和更新多源知识,轻松构建个人知识库
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
76 25
|
19天前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
1月前
|
存储 人工智能 数据库
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。
90 11
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
|
19天前
|
人工智能 供应链 安全
面向高效大模型推理的软硬协同加速技术 多元化 AI 硬件引入评测体系
本文介绍了AI硬件评测体系的三大核心方面:统一评测标准、平台化与工具化、多维度数据消费链路。通过标准化评测流程,涵盖硬件性能、模型推理和训练性能,确保评测结果客观透明。平台化实现资源管理与任务调度,支持大规模周期性评测;工具化则应对紧急场景,快速适配并生成报告。最后,多维度数据消费链路将评测数据结构化保存,服务于综合通用、特定业务及专业性能分析等场景,帮助用户更好地理解和使用AI硬件。
|
1月前
|
人工智能 算法 搜索推荐
2024 “AI+硬件创新大赛”获奖名单出炉,浙大、上交与复旦联队等夺冠
2024年11月30日,由开放源子开源基金会主办,魔搭社区、英特尔与阿里云共同承办的“AI+硬件创新大赛”总决赛在杭州圆满落幕。
2024 “AI+硬件创新大赛”获奖名单出炉,浙大、上交与复旦联队等夺冠
|
2月前
|
人工智能 机器人 信息无障碍
11月30日“2024 AI+硬件创新大赛”决赛-杭州西湖体育馆见!
探索AI硬件创新,28强团队决战杭州西湖体育馆
11月30日“2024 AI+硬件创新大赛”决赛-杭州西湖体育馆见!
|
2月前
|
人工智能 安全 JavaScript
Open Interpreter:AI 赋能终端!在终端中对话AI模型进行编程,通过运行代码来完成各种计算机操作任务
Open Interpreter 是一个让语言模型运行代码的强大工具,提供了一个类似 ChatGPT 的界面,支持多种编程语言和丰富的功能。
115 7
Open Interpreter:AI 赋能终端!在终端中对话AI模型进行编程,通过运行代码来完成各种计算机操作任务
|
2月前
|
传感器 人工智能 机器人

热门文章

最新文章