采样率(sample rate)

简介: 采样率(sample rate)

  采样率(sample rate)

  音频采样率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。

  目前语音识别服务支持16000Hz和8000Hz两种采样率,其中电话业务一般使用8000Hz,其余业务使用16000Hz。

  调用语音识别服务时,如果语音数据采样率高于16000Hz,需要先把采样率转换为16000Hz才能发送给语音识别服务;如果语音数据采样率是8000Hz,请勿将采样率转换为16000Hz,项目中选用支持8000Hz采样率的模型。

  采样位数(sample size)

  采样值或取样值,即是将采样样本幅度量化。用来衡量声音波动变化的参数,或是声卡的分辨率。数值越大、分辨率越高,发出声音的能力越强。

  目前语音识别中常用的采样位数为16bits小端序。即每次采样的音频信息用2字节保存,或者说2字节记录1/16000s的音频数据。

  每个采样数据记录的是振幅,采样精度取决于采样位数的大小:

  1字节(8bit)记录256个数,亦即将振幅划分为256个等级。

  2字节(16bit)记录65536个数。

  其中2字节采样位数已经能够达到CD标准。

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
2月前
GEE错误——超限问题解决Export too large: specified 375255165 pixels (max: 100000000)
GEE错误——超限问题解决Export too large: specified 375255165 pixels (max: 100000000)
100 10
|
6月前
paraformer支持设置 speech_noise_threshold 这个参数吗 ?
请问:speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 这个模型支持设置 speech_noise_threshold 这个参数吗 ? vad 本身是支持的,但对这个集成的模型好像不起作用? 如果支持,应该如何正确地设置呢 ? 如果不支持,那该模型有没有什么方法可以过滤掉背景噪声? 经常会有背景噪声被识别出文字
32 0
|
6月前
paraforme支持speech_noise_threshold吗?
请问:speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 这个模型支持设置 speech_noise_threshold 这个参数吗 ? vad 本身是支持的,但对这个集成的模型好像不起作用? 如果支持,应该如何正确地设置呢 ? 如果不支持,那该模型有没有什么方法可以过滤掉背景噪声? 经常会有背景噪声被识别出文字
17 0
|
8月前
|
存储 编解码 语音技术
swr_get_out_samples和swr_convert,比特率重采样
swr_get_out_samples和swr_convert,比特率重采样
111 0
swr_get_out_samples和swr_convert,比特率重采样
|
人工智能 自然语言处理 PyTorch
使用Unit Scaling进行FP16 和 FP8 训练
Unit Scaling 是一种新的低精度机器学习方法,能够在没有损失缩放的情况下训练 FP16 和 FP8 中的语言模型。
163 0
使用Unit Scaling进行FP16 和 FP8 训练
|
编解码
《RealityCodec H.265HEVC Low Delay(I&P)Encoder》电子版地址
RealityCodec H.265/HEVC Low Delay(I&P)Encoder
45 3
《RealityCodec H.265HEVC Low Delay(I&P)Encoder》电子版地址
《Audio Tagging with Compact Feedforward Sequential Memory Network and Audio-to-Audio Ratio Based Data Augmentation》电子版地址
Audio Tagging with Compact Feedforward Sequential Memory Network and Audio-to-Audio Ratio Based Data Augmentation
55 0
《Audio Tagging with Compact Feedforward Sequential Memory Network and Audio-to-Audio Ratio Based Data Augmentation》电子版地址
|
算法 计算机视觉
泊松分布采样 (Poisson-Disk-Sample)代码及详细注释【OpenCV】
泊松分布采样 (Poisson-Disk-Sample)代码及详细注释【OpenCV】
729 0
泊松分布采样 (Poisson-Disk-Sample)代码及详细注释【OpenCV】
|
调度
6.2.2UE maximum output power reduction-翻译
6.2.2UE maximum output power reduction-翻译
245 0
|
测试技术 调度
6.2.1.1UE maximum output power - EIRP and TRP——翻译
6.2.1.1UE maximum output power - EIRP and TRP——翻译
326 0