智能硬件如何自测声学部分是否符合量产条件

简介: 智能硬件如何自己就能开展声学自测工作。

先明确智能硬件中声学(麦克风)使用的三个场景,避免简单的问题复杂化。

第一个场景,通话使用。这是大部分智能硬件设计麦克风的主要原因,很多声学做起来感觉很简单的错觉也来源于此。

第二个场景,较安静环境下人机交互。复用第一个场景的声学硬件,第二个场景马马虎虎也能用,虽然部分情况下效果不理想,但是,还没到完全不能用的状态。

第三个场景,高噪环境下人机交互。主要是户外和人流量较多的环境下使用人机交互,第一个场景的声学硬件完全不能使用。

对于第一个场景,通话使用,现在的主流芯片基本上已经内置了通话降噪算法,再加上绝大部分通话都是在安静场景下,因此,只要麦克风的性能指标不是太拉跨、电路设计没有硬伤,第一个场景中智能硬件的声学部分并不用做额外的测试。但是,很多开发者带着这样的惯性开发第二个和第三个场景的智能硬件时,就完全走不通了,售后问题比比皆是,基本都集中在声音处理上。

那么,对于第二个和第三个场景,应该如何科学地自测声学部分呢?怎么判断声学部分是否符合量产条件呢?

下面分享声学自测的规范。

测试环境准备:

  • 环境安静,噪音<40dB,如无条件,选安静会议室
  • 设备周围无遮挡物

测试工具准备:

  • 待测设备---预留50MB存储空间
  • 专业声压计--- 条件有限可使用手机app(例:手机应用市场-- Sound Meter HD)
  • 音频分析软件---Audition
  • 高保真音箱---条件有限可使用蓝牙音箱,无蓝牙音箱可使用电脑
  • 密封材料---淘宝购买 EVA海绵密封胶带10mm厚度

测试音频准备:

  • 密封性测试音频(白噪声)
  • 1khz音频
  • 信号质量测试音频

测试附件准备:单独提供

  • 测试记录表格《声学测试结果目标》
  • 测试音频附件

测试方法

一、自播自录制测试

1-10项测试只录制一个音频:

(1)设备调节到100%音量

(2)设备先开始录制音频并保存,然后设备播放信号质量测试音频

 (3) 自播自录后,人正常说话,测试mic处人声音量为65db,保存原始音频和识别音频

1、mic和回采幅度检查

最低幅度检查

1.用Audition软件打开音频,检查采样值。识别引擎要求采样值>2k,确保mic处65db人正常说话时峰值振幅采样值>2k。否则需要提高mic增益

截幅检查

  1. 检查每个声道振幅最大部分,确保每个声道无截幅
  2. 鼠标中间放大波形,保证波形连续,且无削顶

整改方式:减小增益或降低最大音量,让设备最大音量播放歌曲时,音频不截幅

2、幅度一致性(单麦免测)

(1)确保所有mic声道的幅度均值差值≤3db

         示例:1声道(-12db ),2声道(-9db),相差3db合格

(2)回采的增益不能太小,最大音量时在[-1,-9] DBFS之间

(3)双回采平均幅度差≤3db

3、通道顺序稳定性检查

多次录音, 同一个mic对应软件中的声道要固定。可以多次录音按相同顺序用手轻触麦克风,录音上会有比较明显的振幅,检查多次录音的麦序

4、底噪检查

(1)不播放音乐时,回采底噪<-65dbfs  

        安静环境下,设备底噪 < -50dbfs

操作方法:最右侧数字区域鼠标右键选择Decibels

(2)运行时底噪检查(设备运行时自噪较大的设备才需要测,比如投影仪运行时有风扇噪声,扫地机工作时的噪声,其他免测。)

   让设备运行应用,使cpu占用>70%, 此时用声压计测量mic处噪声≤50db

5、丢数据检查

查看音频的长度(Duration)是否为21.6

丢数据可能原因:

(1)重采样算法异常

(2)驱动异常

2.在频谱上找一竖一竖的地方, 看时域波形采样点是否减少,如下图的频域波形,对应的时域少了5个采样点

6、最大音量检查

设备最大音量播放音频进行测试。

  1. AEC算法消除量为30db左右, 建议麦克风口处最大音量<=85dB,打断唤醒效果较好
  2. 特殊场景,例如全双工, 建议麦克风口处最大音量<=75db,打断唤醒效果较好

7、回采信号检查

(1)回采信号提前于mic信号,时间差<80ms

(2)每次录制时,回采和MIC时延差稳定

(3)回采与原信号波形基本一致,无畸变

(4)回采不能截幅

反例: (1)回采比MIC慢

          (2)回采和MIC信号的时间差太长

          (3)电视盒子外接电视的喇叭,时延差不可控,效果会受很大的影响

8、波形失真

原因:音量太大导致失真

质量测试音频原始波形(下图)

设备回采波形失真(下图)注:轻微型波形失真也算失真

9、单双回采检查

如果有2个喇叭,2回采信号效果更好

10、喇叭主观听感

测试方法:最大音量播放0dB 20Hz-20kHz的扫描信号,有无POP噪声/失真感/破音/共振音/杂音

11、麦克风阵列角度检查

二、相位一致性检查(单麦免测)

正常情况:麦克风同一时刻的相位一致(波形一致)

                 回采同一时刻可以一致或者反向

检查方法:找原始音频正弦波的位置进行检查

异常情况

三、密封性和通道顺序测试

1、录制音频

    1.音箱和待测设备距离20~30cm

    2.音箱播放,调节音量使待测设备麦克风(Mic)处音量为80~90dB(估算)

    3.设备录音并保存文件,命名为 sealing_test.pcm

    4.使用EVA海绵胶带10mm厚度(淘宝可购买)按逆时针顺序逐个密封mic,密封后停顿5~10秒,然后换下一个mic堵住继续该操作至结束。

2、 导入音频文件

1.结束录音,导出录音文件,确保格式为wav。

2.拖动文件到audition软件中,根据设备情况选择采样率和声道数

由于白噪声能量较高,可以清楚看到被堵mic的频段,同时也能看到mic的顺序。如下图所示,实际mic顺序和测试顺序一致,时域谱中每个通道振幅明显较大的部分(或者频域谱中每个通道中暗的部分)即为被堵住mic的部分。

3.、对比声道振幅

     1.单击鼠标左键不松开,拖动选择区域后松开鼠标左键, 选中声道1中堵住mic停顿5s~10s区间的部分

       注意:在选择扫描选区的时候,请选择停顿 5~10s 的中间的平坦部分,不要将有信号残留的部分选中,这部分会影响最后的结果!

    2.依次点击窗口(Window),振幅统计(Amplitude Statistics),扫描选区(Scan Selection)

   3.查看平均RMS振幅(Average RMS Amplitude),声道1密封 -57.26dB,其他声道未密封为-28dB,差值30dB>气密标准10dB,单声道气密性合格。要求设备所有mic气密性合格

反例:第2和第6声道气密性不合格

四、算法效果测试

使用降噪测试工具处理保存的质量测试音频,检查降噪后的音频回声残留量,残留噪声低于-30dbfs

以上,是整个声学部分自测的全部流程。

目录
相关文章
|
3月前
|
机器学习/深度学习 人工智能
阿里轨迹可控版Sora,告别抽卡,让视频生成更符合物理规律
【8月更文挑战第26天】阿里团队新推出的Tora视频生成模型是对先前Sora模型的重要升级。Tora通过引入轨迹控制机制,极大提升了视频中物体运动的真实性和准确性。其核心技术包括轨迹提取器、运动指导融合器及空间时间扩散变换器,共同确保视频既高质量又流畅。实验表明,Tora在清晰度、细节表现力及运动轨迹控制上均有显著进步。尽管如此,模型训练复杂度和轨迹理解能力仍有待优化。[论文](https://arxiv.org/pdf/2407.21705)
46 2
|
传感器 机器学习/深度学习 人工智能
「纯视觉」与「多传感器」路线之争背后,久未解决的3大难题
「纯视觉」与「多传感器」路线之争背后,久未解决的3大难题
352 0
|
传感器 安全 自动驾驶
摆脱「黑盒子」后,理想汽车的自研进展达到预期了吗?
摆脱「黑盒子」后,理想汽车的自研进展达到预期了吗?
217 0
摆脱「黑盒子」后,理想汽车的自研进展达到预期了吗?
|
存储 供应链 搜索推荐
商用平板 未来价值有待再定义
商用平板 未来价值有待再定义
商用平板 未来价值有待再定义
|
传感器 自动驾驶 安全
智能汽车路线现纷争,博弈正进行,AliOS不惧打硬仗
AliOS高级产品经理佘士东认为智能网联车目前存在着三条技术路线,分别是操作系统、超级APP和ROM,三条技术路线代表着三种不同的产品思维。
355 0
|
安全 新能源
拜腾与博世将在动力系统、驾驶员辅助等方面展开重点合作
双方拟建立平台以在品牌推广、产品营销等方面深入合作。
306 0
下一篇
无影云桌面