【使用机器学习和深度学习对城市声音进行分类】基于两种技术（ML和DL）对音频数据（城市声音）进行分类（Matlab代码实现）-阿里云开发者社区

【使用机器学习和深度学习对城市声音进行分类】基于两种技术（ML和DL）对音频数据（城市声音）进行分类（Matlab代码实现）

2023-08-07 526

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【使用机器学习和深度学习对城市声音进行分类】基于两种技术（ML和DL）对音频数据（城市声音）进行分类（Matlab代码实现）

💥1 概述

使用机器学习和深度学习对城市声音进行分类是一个有趣的研究课题。下面是一种基本的方法，结合了机器学习（ML）和深度学习（DL）技术：

1. 数据收集和预处理：收集大量城市声音的音频数据集。可以使用麦克风或其他录音设备在不同城市环境下进行采集。确保采集到的音频数据有足够的多样性和代表性。对音频数据进行预处理，如音频剪辑、采样率调整、去噪等。

2. 特征提取：从音频数据中提取有代表性的特征向量。可以使用机器学习常见的音频特征提取方法，如Mel频谱系数（MFCC）、音频能量、过零率等。这些特征可以帮助机器学习和深度学习模型发现城市声音的区别和模式。

3. 机器学习分类：使用机器学习算法对提取的音频特征进行分类。选择适合音频分类的机器学习算法，如支持向量机（SVM）、随机森林（Random Forest）或K最近邻（K-Nearest Neighbors）等。使用预处理的音频数据和特征向量训练机器学习模型，并对其进行评估和优化。

4. 深度学习分类：构建深度学习模型进行城市声音分类。使用深度学习算法，如卷积神经网络（CNN）或循环神经网络（RNN）构建分类模型。使用音频数据的原始波形或经过预处理的特征作为输入，训练深度学习模型并进行模型优化。

5. 模型评估和比较：使用预留的测试集评估机器学习和深度学习模型的性能。比较两种技术在城市声音分类任务上的准确率、召回率、精确率等指标。根据评估结果选择更有效的模型。

6. 可解释性分析：对分类结果进行可解释性分析。了解哪些特征对城市声音的分类起到重要作用，或者使用可解释性方法（如Grad-CAM）来查看深度学习模型对城市声音的决策过程。

7. 模型优化和改进：根据分析结果和实际需求，对机器学习和深度学习模型进行优化和改进。可以尝试使用更复杂的模型架构、调整超参数或增加数据样本等来提高模型的性能。

通过上述方法，可以使用机器学习和深度学习技术对城市声音进行分类。机器学习方法适用于特征提取和分类，而深度学习方法可以直接处理原始音频数据，从而更好地捕捉城市声音的特征和模式。结合两种技术可以提高分类的准确性和效果，对于城市环境监测、噪音控制等方面具有实际应用价值。

该数据集包含来自 8732 个类的 4 个城市声音摘录（<=10 秒），它们是：

空调

汽车喇叭

儿童玩耍

狗吠

钻井

引擎怠速

枪射击

手提钻

警笛

街头音乐

随附的元数据包含每个声音摘录的唯一 ID 及其给定的类名。随附的 git 存储库中包含此数据集的示例，可以从此处下载完整数据集。

此示例中有 7 个算例：

算例 1：示例简介，探索和可视化数据

算例 2：使用诊断应用程序设计器对数据

进行预处理和提取功能（信号时域特征和频谱特征）

算例 3：模型训练和评估

算例 4：模型部署

算例 5：使用 MFCC 提取特征来训练机器学习模型

算例 6：使用小波分析和深度学习对城市声音进行分类

亮点：

为音频数据存储

准备现实数据标准化和规范化数字信号数据（采样率、位深度、通道数）使用不同的方法提取特征（时域信号特征和频谱特征，MFCC，离散小波变换，Haar 1D小波变换）

📚2 运行结果

2.1 算例1

figure()
datafolder = "UrbanSound8K/structure1";
currentfolder = pwd;
cd(datafolder);
listdir=dir;  
for i=3:1:length(listdir)
    cd(listdir(i).name)
    inside=dir;
    subplot(3,4,i-2);
    [y,fs]=audioread(inside(4).name);
    plot(y(:,:)); 
    soundsc(y(:,:),fs);
    grid on;
    title(listdir(i).name)
    drawnow;
    pause(2)
    cd(strcat(currentfolder,'\',datafolder));
end

2.2 算例2

figure()
datafolder = "UrbanSound8K/structure";
currentfolder = pwd;
cd(datafolder);
listdir=dir;  
for i=3:1:length(listdir)
    cd(listdir(i).name)
    inside=dir;
    subplot(3,4,i-2);
    [y,fs]=audioread(inside(randi([4,100])).name);
    plot(y(:,:)); 
    soundsc(y(:,:),fs);
    grid on;
    title(listdir(i).name)
    drawnow;
    pause(2)
    cd(strcat(currentfolder,'\',datafolder));
end

2.3 算例3

2.4 算例4

2.5 算例5

figure()
datafolder = "UrbanSound8K/structure";
currentfolder = pwd;
cd(datafolder);
listdir=dir;  
for i=3:1:length(listdir)
    cd(listdir(i).name)
    inside=dir;
    subplot(3,4,i-2);
    [y,fs]=audioread(inside(4).name);
    plot(y(:,:)); 
    soundsc(y(:,:),fs);
    grid on;
    title(listdir(i).name)
    drawnow;
    pause(5)
    cd(strcat(currentfolder,'\',datafolder));
end