基于MFCC和gmm特征实现语音识别附matlab代码

简介: 基于MFCC和gmm特征实现语音识别附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。

🍎个人主页:Matlab科研工作室

🍊个人信条:格物致知。

更多Matlab仿真内容点击👇

智能优化算法       神经网络预测       雷达通信      无线传感器        电力系统

信号处理              图像处理               路径规划       元胞自动机        无人机

⛄ 内容介绍

采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别系统.MFCC主要的是模拟人耳的听觉过程,相对于其它参数它对语音波形的变化不敏感,更加稳定,系统取得很好的识别结果,实验表明系统训练和识别的计算量和存储量都比较低.

⛄ 部分代码

function c=melcepst(s,fs)

%mel 倒谱计算,仿照的是voicebox的写法简化了

if nargin<2 fs=8000; end

w='M';         %汉明窗

nc=12;        %mfcc维数

p=floor(3*log(fs));   %滤波器个数

n=pow2(floor(log2(0.03*fs)));  %n是一帧FFT后数据的长度


  fh=0.5;       %最高频率已经归一化处理了 fs/2  

  fl=0;         %一般都是0

  inc=floor(n/2);  %帧移

if length(w)==0   %如果没有设计窗函数,默认汉明窗

  w='M';

end

  z=enframe(s,hamming(n),inc);   %分帧处理,汉明窗加窗

f=rfft(z.');                      %实数的快速傅里叶变换

[m,a,b]=melbankm(p,n,fs,fl,fh,w); %     m为滤波器的频域响应

                                 %mn   the lowest fft bin with a non-zero coefficient

                                 %mx  the highest fft bin with a non-zero coefficient

pw=f(a:b,:).*conj(f(a:b,:));   %计算帧能量

pth=max(pw(:))*1E-6;           %最大帧能量*10^-6

ath=sqrt(pth);

  y=log(max(m*abs(f(a:b,:)),ath));  %求出filters act in the absolute magnitude domain (default)

c=rdct(y).';          %实数的离散余弦变换

nf=size(c,1);      

nc=nc+1;              %得到13维系数

if p>nc

  c(:,nc+1:end)=[];  % 当滤波器个数比所需维数多的时候,就将后面滤波器获得的参数删去

elseif p<nc

  c=[c zeros(nf,nc-p)]; %滤波器个数少的时候,用0补齐

end

%得到 mel cepstrum output: one frame per row

%例如用了Rec语音检测,得到c 337*13维;将语音分成337帧,每一行得到13个特征向量表示这一帧

⛄ 运行结果

⛄ 参考文献

[1]王伟, and 邓辉文. "基于MFCC参数和VQ的说话人识别系统." 第四届全国信息获取与处理学术会议 0.

⛳️ 代码获取关注我

❤️部分理论引用网络文献,若有侵权联系博主删除
❤️ 关注我领取海量matlab电子书和数学建模资料



相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
1月前
|
机器学习/深度学习 算法 机器人
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
203 0
|
1月前
|
算法 定位技术 计算机视觉
【水下图像增强】基于波长补偿与去雾的水下图像增强研究(Matlab代码实现)
【水下图像增强】基于波长补偿与去雾的水下图像增强研究(Matlab代码实现)
108 0
|
1月前
|
算法 机器人 计算机视觉
【图像处理】水下图像增强的颜色平衡与融合技术研究(Matlab代码实现)
【图像处理】水下图像增强的颜色平衡与融合技术研究(Matlab代码实现)
|
1月前
|
新能源 Java Go
【EI复现】参与调峰的储能系统配置方案及经济性分析(Matlab代码实现)
【EI复现】参与调峰的储能系统配置方案及经济性分析(Matlab代码实现)
105 0
|
1月前
|
机器学习/深度学习 算法 机器人
使用哈里斯角Harris和SIFT算法来实现局部特征匹配(Matlab代码实现)
使用哈里斯角Harris和SIFT算法来实现局部特征匹配(Matlab代码实现)
141 8
|
1月前
|
机器学习/深度学习 编解码 算法
基于OFDM技术的水下声学通信多径信道图像传输研究(Matlab代码实现)
基于OFDM技术的水下声学通信多径信道图像传输研究(Matlab代码实现)
134 8
|
1月前
|
机器学习/深度学习 数据采集 测试技术
基于CEEMDAN-VMD-BiLSTM的多变量输入单步时序预测研究(Matlab代码实现)
基于CEEMDAN-VMD-BiLSTM的多变量输入单步时序预测研究(Matlab代码实现)
|
1月前
|
机器学习/深度学习 算法 自动驾驶
基于导向滤波的暗通道去雾算法在灰度与彩色图像可见度复原中的研究(Matlab代码实现)
基于导向滤波的暗通道去雾算法在灰度与彩色图像可见度复原中的研究(Matlab代码实现)
153 8
|
1月前
|
编解码 运维 算法
【分布式能源选址与定容】光伏、储能双层优化配置接入配电网研究(Matlab代码实现)
【分布式能源选址与定容】光伏、储能双层优化配置接入配电网研究(Matlab代码实现)
152 12
|
1月前
|
人工智能 数据可视化 网络性能优化
【顶级SCI复现】虚拟电厂的多时间尺度调度:在考虑储能系统容量衰减的同时,整合发电与多用户负荷的灵活性研究(Matlab代码实现)
【顶级SCI复现】虚拟电厂的多时间尺度调度:在考虑储能系统容量衰减的同时,整合发电与多用户负荷的灵活性研究(Matlab代码实现)
101 9

热门文章

最新文章