基于MFCC和gmm特征实现语音识别附matlab代码-阿里云开发者社区

基于MFCC和gmm特征实现语音识别附matlab代码

2023-05-30 155 发布于福建

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 基于MFCC和gmm特征实现语音识别附matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。

🍎个人主页：Matlab科研工作室

🍊个人信条：格物致知。

更多Matlab仿真内容点击👇

智能优化算法神经网络预测雷达通信无线传感器电力系统

信号处理图像处理路径规划元胞自动机无人机

⛄ 内容介绍

采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别系统.MFCC主要的是模拟人耳的听觉过程,相对于其它参数它对语音波形的变化不敏感,更加稳定,系统取得很好的识别结果,实验表明系统训练和识别的计算量和存储量都比较低.

⛄ 部分代码

function c=melcepst(s,fs)

%mel 倒谱计算，仿照的是voicebox的写法简化了

if nargin<2 fs=8000; end

w='M'; %汉明窗

nc=12; %mfcc维数

p=floor(3*log(fs)); %滤波器个数

n=pow2(floor(log2(0.03*fs))); %n是一帧FFT后数据的长度

fh=0.5; %最高频率已经归一化处理了 fs/2

fl=0; %一般都是0

inc=floor(n/2); %帧移

if length(w)==0 %如果没有设计窗函数，默认汉明窗

w='M';

end

z=enframe(s,hamming(n),inc); %分帧处理，汉明窗加窗

f=rfft(z.'); %实数的快速傅里叶变换

[m,a,b]=melbankm(p,n,fs,fl,fh,w); % m为滤波器的频域响应

%mn the lowest fft bin with a non-zero coefficient

%mx the highest fft bin with a non-zero coefficient

pw=f(a:b,:).*conj(f(a:b,:)); %计算帧能量

pth=max(pw(:))*1E-6; %最大帧能量*10^-6

ath=sqrt(pth);

y=log(max(m*abs(f(a:b,:)),ath)); %求出filters act in the absolute magnitude domain (default)

c=rdct(y).'; %实数的离散余弦变换

nf=size(c,1);

nc=nc+1; %得到13维系数

if p>nc

c(:,nc+1:end)=[]; % 当滤波器个数比所需维数多的时候，就将后面滤波器获得的参数删去

elseif p<nc

c=[c zeros(nf,nc-p)]; %滤波器个数少的时候，用0补齐

end

%得到 mel cepstrum output: one frame per row

%例如用了Rec语音检测，得到c 337*13维;将语音分成337帧，每一行得到13个特征向量表示这一帧

⛄ 运行结果

⛄ 参考文献

[1]王伟, and 邓辉文. "基于MFCC参数和VQ的说话人识别系统." 第四届全国信息获取与处理学术会议 0.

⛳️ 代码获取关注我

❤️部分理论引用网络文献，若有侵权联系博主删除

❤️ 关注我领取海量matlab电子书和数学建模资料

相关实践学习

达摩院智能语音交互 - 声纹识别技术

声纹识别是基于每个发音人的发音器官构造不同，识别当前发音人的身份。按照任务具体分为两种：声纹辨认：从说话人集合中判别出测试语音所属的说话人，为多选一的问题声纹确认：判断测试语音是否由目标说话人所说，是二选一的问题（是或者不是）按照应用具体分为两种：文本相关：要求使用者重复指定的话语，通常包含与训练信息相同的文本（精度较高，适合当前应用模式）文本无关：对使用者发音内容和语言没有要求，受信道环境影响比较大，精度不高本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。讲师介绍：郑斯奇，达摩院算法专家，毕业于美国哈佛大学，研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。

基于MFCC和gmm特征实现语音识别附matlab代码

⛄ 内容介绍

⛄ 部分代码

⛄ 运行结果

⛄ 参考文献

⛳️ 代码获取关注我

❤️部分理论引用网络文献，若有侵权联系博主删除

❤️ 关注我领取海量matlab电子书和数学建模资料

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

基于MFCC和gmm特征实现语音识别附matlab代码

⛄ 内容介绍

⛄ 部分代码

⛄ 运行结果

⛄ 参考文献

⛳️ 代码获取关注我

❤️部分理论引用网络文献，若有侵权联系博主删除

❤️ 关注我领取海量matlab电子书和数学建模资料

热门文章

最新文章

相关课程

相关电子书

相关实验场景