开发者社区> 问答> 正文

智能语音交互、语音AI中pcm对应下面那种格式:PCM_FLOAT PCM_SIGNED PCM?

智能语音交互、语音AI中pcm对应下面那种格式:PCM_FLOAT PCM_SIGNED PCM_UNSIGNED?voice-a9a2fbd 看看这个模型怎么失败了,个性化人声定制?image.png 这个接口我们都调了image.png 每次点下一次,我们都会检测的,通过了才会进行下一个http://guo-bo.oss-cn-zhangjiakou.aliyuncs.com/img/313dedfc491e499d94e0d81c7faffe92.pcm看看这个格式对不对

展开
收起
真的很搞笑 2023-07-04 14:18:39 107 0
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    智能语音交互和语音 AI 中,PCM 是一种常见的音频数据格式,被广泛应用于音频采集、处理和编解码等方面。PCM 数据通常是由一系列采样值组成的,每个采样值表示声音在某个时间点的振幅大小,采样值的数量和精度会影响音频数据的质量和大小。

    PCM 数据格式通常包括以下几种:

    PCM_SIGNED:有符号整型 PCM 数据格式,采样值的取值范围为 -2^(n-1) 到 2^(n-1)-1,其中 n 表示采样位数。例如,采样位数为 16 位时,取值范围为 -32768 到 32767。

    PCM_UNSIGNED:无符号整型 PCM 数据格式,采样值的取值范围为 0 到 2^n-1,其中 n 表示采样位数。例如,采样位数为 8 位时,取值范围为 0 到 255。

    PCM_FLOAT:浮点型 PCM 数据格式,采样值的取值范围为 -1 到 1,其中 1 表示最大振幅,-1 表示最小振幅。采样位数通常为 32 位或者 64 位。

    2023-07-31 07:59:58
    赞同 展开评论 打赏
  • 我们是wav格式 公有云录制的20句话最后都是wav,您这个是文件有问题 正常的wav头有采样率,bit和duration,ptts是有手机扫码然后录音的,此回答整理自钉群“阿里语音AI【4群】”

    2023-07-04 14:57:07
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Data+AI时代大数据平台应该如何建设 立即下载
大数据AI一体化的解读 立即下载
当搜索遇见AI 立即下载