【端点检测】短时能量和过零率双门限语音端点检测附matlab代码

简介: 【端点检测】短时能量和过零率双门限语音端点检测附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。

🍎个人主页:Matlab科研工作室

🍊个人信条:格物致知。

更多Matlab仿真内容点击👇

智能优化算法       神经网络预测       雷达通信      无线传感器        电力系统

信号处理              图像处理               路径规划       元胞自动机        无人机

⛄ 内容介绍

短时能量和过零率双门限语音端点检测是一种常见的语音处理方法,用于检测语音信号中的起始点和终止点。下面是基于短时能量和过零率的双门限语音端点检测的基本原理:

  1. 分帧:将输入的连续语音信号划分为一系列重叠的短时帧。每个帧通常持续几十毫秒至几百毫秒。
  2. 计算短时能量:对于每个帧,计算该帧内采样点的平方和,即短时能量。可以通过对每个采样点进行平方,并对得到的结果求和来计算短时能量。
  3. 计算短时过零率:对于每个帧,计算过零率,即负波形交叉的次数。过零率越高,表示波形变化越频繁。
  4. 设置能量和过零率阈值:根据实际需求,设置能量阈值和过零率阈值。这些阈值可根据数据集的特征进行调整。
  5. 端点检测:从第一个帧开始扫描每个帧,当满足以下条件时被视为语音段的起始点:
    类似地,反向扫描,当满足以下条件时被视为语音段的终止点:
  • 当前帧的能量超过能量阈值;
  • 后一帧的能量未超过能量阈值;
  • 当前帧的过零率超过过零率阈值。
  • 当前帧的能量超过能量阈未超过能量阈值;
  • 当前帧的过零率超过过零率阈值。
  1. 得到语音段:根据检测到的起始点和终止点,将对应的语音段提取出来作为最终的语音结果。

需要注意的是,能量和过零率的阈值设置会直接影响端点检测的准确性和灵敏度。若设定过高的阈值,则可能导致端点漏检;若设定过低的阈,则可能会产生误检。因此,在实际应用中,需要根据具体数据集和应用场景进行合适的参数调整。

⛄ 部分代码

function f=enframe(x,win,inc)%定义函数。

nx=length(x(:)); %x(:)的作用是把x给弄成一个向量,x为一行,则变成一列,如果为矩阵,则按每一列的顺序排成一列。得出的nx为序列的数据个数。

nwin=length(win);

if (nwin == 1)

   len = win; %如果win中就一个数,则len就=该数,此例中为256个点。即每帧长

else

   len = nwin; %如果有多个数,则len=个数。

end

if (nargin < 3) % nargin返回的是函数输入的个数,如果中间有变量,返回的是负值。

   inc = len; %也就是说,如果函数enframe的输入只有两个的话,系统就自动赋inc

end

nf = fix((nx-len+inc)/inc);%这个比较关键,nf为分帧的组数,结合下边的可以分析这里

                                   %各参数的意义,len为帧长,inc为未覆盖的数据,nx为整个数

                   % 据量。假设数据为1:30,len为10,未覆盖为5,则nf=5,5

                  %  组,第一组为1,2,……10,第二组为6,7,……15,依次列

%推,便可知其缘由,即(nx-len )/inc + 1;

f=zeros(nf,len);             %构成以组数为行,帧长为列的矩阵。

indf= inc*(0:(nf-1)).'; %indf为一列nf个数据,即0到nf-1的inc倍,即分好了每幀起点。

inds = (1:len);      %构成了长度为len的一行。

f(:) = x(indf(:,ones(1,len))+inds(ones(nf,1),:));

                           %上一条语句为整个算法的核心部分了,indf(:,ones(1,len))把indf的

                       % 第一列扩展了nf*len的矩阵。同理inds(ones(nf,1),:)把inds第一行扩

%展为nf*len的矩阵,相加得到

%inc+1 inc+2 inc+3 …… inc+len

%2*inc+1………… ……2*inc+len

%…………………………………]然后就按照这个矩阵从x中把数据给选出来,达到分帧的目的。

if (nwin > 1)    %nwin大于1的情况就不说了。

w = win(:)';

f = f .* w(ones(nf,1),:);

end

⛄ 运行结果

⛄ 参考文献

[1] 韦向峰,袁毅,张全,等.基于端点检测的蒙藏维语音片段数据集[J].中国科学数据:中英文网络版, 2019, 4(4):11.DOI:10.11922/csdata.2019.0024.zh.

[2] 刘波,聂明新,向俊涛.基于短时能量和过零率分析的语音端点检测方法研究[J].  2007.

[3] 卓嘎,边巴旺堆,姜军.基于短时平均能量和短时过零率的藏语语音端点检测研究[J].电脑知识与技术:学术版, 2014(11):4.DOI:CNKI:SUN:DNZS.0.2014-31-082.

⛳️ 代码获取关注我

❤️部分理论引用网络文献,若有侵权联系博主删除
❤️ 关注我领取海量matlab电子书和数学建模资料

🍅 仿真咨询

1.卷积神经网络(CNN)、LSTM、支持向量机(SVM)、最小二乘支持向量机(LSSVM)、极限学习机(ELM)、核极限学习机(KELM)、BP、RBF、宽度学习、DBN、RF、RBF、DELM实现风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断
2.图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知
3.旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、车辆协同无人机路径规划
4.无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配
5.传感器部署优化、通信协议优化、路由优化、目标定位
6.信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号
7.生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化
8.微电网优化、无功优化、配电网重构、储能配置
9.元胞自动机交通流 人群疏散 病毒扩散 晶体生长


相关文章
|
1月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于MSER和HOG特征提取的SVM交通标志检测和识别算法matlab仿真
### 算法简介 1. **算法运行效果图预览**:展示算法效果,完整程序运行后无水印。 2. **算法运行软件版本**:Matlab 2017b。 3. **部分核心程序**:完整版代码包含中文注释及操作步骤视频。 4. **算法理论概述**: - **MSER**:用于检测显著区域,提取图像中稳定区域,适用于光照变化下的交通标志检测。 - **HOG特征提取**:通过计算图像小区域的梯度直方图捕捉局部纹理信息,用于物体检测。 - **SVM**:寻找最大化间隔的超平面以分类样本。 整个算法流程图见下图。
|
2月前
|
缓存 算法 物联网
基于AODV和leach协议的自组网络平台matlab仿真,对比吞吐量,负荷,丢包率,剩余节点个数,节点消耗能量
本系统基于MATLAB 2017b,对AODV与LEACH自组网进行了升级仿真,新增运动节点路由测试,修正丢包率统计。AODV是一种按需路由协议,结合DSDV和DSR,支持动态路由。程序包含参数设置、消息收发等功能模块,通过GUI界面配置节点数量、仿真时间和路由协议等参数,并计算网络性能指标。 该代码实现了节点能量管理、簇头选举、路由发现等功能,并统计了网络性能指标。
162 73
|
3天前
|
运维 算法
基于Lipschitz李式指数的随机信号特征识别和故障检测matlab仿真
本程序基于Lipschitz李式指数进行随机信号特征识别和故障检测。使用MATLAB2013B版本运行,核心功能包括计算Lipschitz指数、绘制指数曲线、检测故障信号并标记异常区域。Lipschitz指数能够反映信号的局部动态行为,适用于机械振动分析等领域的故障诊断。
|
9天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于GA-PSO-SVM算法的混沌背景下微弱信号检测matlab仿真
本项目基于MATLAB 2022a,展示了SVM、PSO、GA-PSO-SVM在混沌背景下微弱信号检测中的性能对比。核心程序包含详细中文注释和操作步骤视频。GA-PSO-SVM算法通过遗传算法和粒子群优化算法优化SVM参数,提高信号检测的准确性和鲁棒性,尤其适用于低信噪比环境。
|
2月前
|
监控 算法 数据安全/隐私保护
基于视觉工具箱和背景差法的行人检测,行走轨迹跟踪,人员行走习惯统计matlab仿真
该算法基于Matlab 2022a,利用视觉工具箱和背景差法实现行人检测与轨迹跟踪,通过构建背景模型(如GMM),对比当前帧与模型差异,识别运动物体并统计行走习惯,包括轨迹、速度及停留时间等特征。演示三维图中幅度越大代表更常走的路线。完整代码含中文注释及操作视频。
|
3月前
|
安全
【2023高教社杯】D题 圈养湖羊的空间利用率 问题分析、数学模型及MATLAB代码
本文介绍了2023年高教社杯数学建模竞赛D题的圈养湖羊空间利用率问题,包括问题分析、数学模型建立和MATLAB代码实现,旨在优化养殖场的生产计划和空间利用效率。
191 6
【2023高教社杯】D题 圈养湖羊的空间利用率 问题分析、数学模型及MATLAB代码
|
3月前
|
存储 算法 搜索推荐
【2022年华为杯数学建模】B题 方形件组批优化问题 方案及MATLAB代码实现
本文提供了2022年华为杯数学建模竞赛B题的详细方案和MATLAB代码实现,包括方形件组批优化问题和排样优化问题,以及相关数学模型的建立和求解方法。
122 3
【2022年华为杯数学建模】B题 方形件组批优化问题 方案及MATLAB代码实现
|
3月前
|
机器学习/深度学习 监控 算法
基于深度学习网络的人员行为视频检测系统matlab仿真,带GUI界面
本仿真展示了基于GoogLeNet的人员行为检测系统在Matlab 2022a上的实现效果,无水印。GoogLeNet采用创新的Inception模块,高效地提取视频中人员行为特征并进行分类。核心程序循环读取视频帧,每十帧执行一次分类,最终输出最频繁的行为类别如“乐队”、“乒乓球”等。此技术适用于智能监控等多个领域。
69 4
|
3月前
|
存储 Serverless
【matlab】matlab实现倒谱法基音频率检测和共振峰检测(源码+音频文件)【独一无二】
【matlab】matlab实现倒谱法基音频率检测和共振峰检测(源码+音频文件)【独一无二】
|
3月前
|
数据采集 存储 移动开发
【2023五一杯数学建模】 B题 快递需求分析问题 建模方案及MATLAB实现代码
本文介绍了2023年五一杯数学建模竞赛B题的解题方法,详细阐述了如何通过数学建模和MATLAB编程来分析快递需求、预测运输数量、优化运输成本,并估计固定和非固定需求,提供了完整的建模方案和代码实现。
88 0
【2023五一杯数学建模】 B题 快递需求分析问题 建模方案及MATLAB实现代码
下一篇
无影云桌面