【机器学习算法】11、高斯混合模型算法+语音识别项目实战(一)

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 【机器学习算法】11、高斯混合模型算法+语音识别项目实战(一)

简介


  高斯混合模型(Gaussian Mixture Model, GMM) 是一种应用广泛的聚类算法。该方法通过对多个高斯模型做线性组合,对样本数据的概率密度分布进行估计,以达到聚类的目的。


   高斯混合模型的主要思想使用高斯分布作为参数模型,并使用期望最大化(EM)算法进行参数估计。其中,每个高斯分布代表一个类。我们将样本数据分别在几个高斯分布上投影, 就得到数据在各个类别上的概率值最大的类作为估计结果。


   从中心极限定理的角度来看,把混合模型假设为高斯模型是较为合理的。当然,也可以根据实际数据假设为任何分布类型的混合模型,不过假设为高斯模型较容易计算和推导。另外,理论上,我们也可以通过增加模型的个数,使高斯混合模型近似任何类型的概率分布。


高斯混合模型的应用领域


(1)数据集分类;

(2)图像分割及特征提取,如医学图像中将直方图的多峰特征看作多个高斯分布的叠加,以解决图像的分割问题;

(3)语音分割及特征提取,如从噪声中提取某个人的声音、 从音乐中提取背景音乐等;

(4)视频分析及特征提取,如智能监控系统中对运动目标检测的检测提取。


高斯混合模型算法流程



高斯混合模型算法具体步骤


(1)构建高斯混合模型;

   首先,需要对高斯混合模型的形式进行改写,以便于使用 EM 算法估计模型参数。高斯混合模型的原始形式如下:

dcc70c64dc7e00cb28b7cc9c7514b06f.png

   其中,K 表示高斯分布模型的个数,K 个模型就对应 K 个聚类。πk为第 k 个模型的权重,也可以看成第 k 类被选中的概率, 引入一个新的 K 维随机变量 z,zk只能取 0 或 1 两个值。zk=1 表示第 k 类被选中的情况,即 p(zk=1)=πk;zk=0 表示第 k 类未被选中的情况。zk 满足以下两个条件:

64839ce6cec1923376c3b817bf217ea1.png

   假设 zk 之间是独立同分布的,可以写出 z 的联合概率分布形式:

dcc70c64dc7e00cb28b7cc9c7514b06f.png

每一类中的数据都服从高斯分布, 用条件概率的形式表示如下:

482a9764ae1e04a0c17aa5cf7b799a6e.png

进而可以写出如下的形式:

29081c4777acab6ccbff55f42a9b6354.png

根据条件概率公式, 可以求出 p(x)的形式:

4550d769a2c0eeba26981296b538b4c5.png

   式(6)为改进后的高斯混合模型,可以看出该式与原始模型有一样的形式。式(6)中引入了新的变量 z,但 zk=0 的项为 1,省略。变量 z 通常称为隐变量。“隐变量” 的意思是:随机选择一个数据点,但是不知道该数据点属于哪一类,数据点的归属观察不到,因此引入隐变量 z 来描述这一现象。


   在贝叶斯的思想下,能够求得后验概率 p(z|x):

3f648c59393c256e242665d212995547.png


(2)EM 算法估计模型参数:

  假设样本数据X={x1,x2,...,xN},高斯混合模型有3个参数需要估计,分别是πk、μk 和Σk。为了估计折3个参数,需要分别求解出这3个参数的最大似然函数。


①初始化模型数目K,对每个模型k设置πk、μk和Ck的初始值。

方案1:将协方差矩阵Ck设置为单位矩阵,每个模型的权重πk=1/K,均值μk设为随机数;

方案2:用K-Means聚类算法对样本进行聚类,得到K值,然后利用各类的均值作为μk,并计算协方差矩阵Σkπk 取各类样本占样本总数的比例。


②估计步骤(E-Step),计算后验概率γ (znk):

根据当前的πk、μk 和Σk,计算后验概率γ(znk)

fa1934f70811f66fa927013b1fc0744e.png

③最大化步骤(M-Step), 更新参数:

根据E-Step中计算的γ(znk)再计算新的πk、μk 和Σk

337e5d48fe005bd26f0da0f47ffd4528.png

N表示样本数量的量,γ(znk)表示数据n属于聚类k的后验概率。Nk表示属于第k个聚类的数据的量。μknew表示第k类数据的加权平均,每个样本数据的权值式γ(znk),跟第 k 个聚类有关。


④收敛条件

计算模型的对数似然函数:

fa93011e1c8079779d54f23b6ba7865a.png

检查参数是否收敛或对数似然函数是否收敛,收敛则推出迭代,否则返回第②步。


算法的改进与优化


   因提出时间较早,随着其他技术的不断更新和完善,高斯混合模型的诸多不足之处也逐渐显露,因此许多高斯混合模型的改进算法也应运而生。高斯混合模型是用高斯概率密度函数精确地量化事物,它是一个将事物分解为若干基于高斯概率密度函数形式的模型。在这个过程中,容易出现K值固定导致估计参数不具有最优性的问题。针对以上算法的不足之处,算法的改进主要为自适应调整K的值。


   高斯混合模型保持固定不变的高斯混合模型的个数K,会造成系统运算资源的浪费。一种改进方法式利用最大似然估计提出高斯混合模型个数的选择方法,引入了负的先验概率,当权值小于阈值时,减少高斯混合模型的个数。另一种改进方法是消除混合分量,在此判断 K 的最优值,从而使高斯混合模型对数据集进行最佳拟合。如果两个混合分量有相同的参数,在混合分量中采用竞争原则,将不必要的分量消除。

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
6天前
|
机器学习/深度学习 数据采集 自然语言处理
理解并应用机器学习算法:神经网络深度解析
【5月更文挑战第15天】本文深入解析了神经网络的基本原理和关键组成,包括神经元、层、权重、偏置及损失函数。介绍了神经网络在图像识别、NLP等领域的应用,并涵盖了从数据预处理、选择网络结构到训练与评估的实践流程。理解并掌握这些知识,有助于更好地运用神经网络解决实际问题。随着技术发展,神经网络未来潜力无限。
|
1天前
|
机器学习/深度学习 人工智能 算法
构建高效机器学习模型的五大策略
【5月更文挑战第20天】 在探索数据科学和人工智能的海洋中,构建一个高效的机器学习模型是航行的关键。本文将深入探讨五个核心策略,以优化模型性能并确保数据驱动的决策更加精准和高效。我们将从特征工程的重要性出发,逐步过渡到选择合适的算法、调参的艺术、避免过拟合以及最终的模型评估与部署。这五大策略共同构成了构建高效机器学习模型的基石,为数据科学家和工程师提供了一条清晰的路径,以应对日益复杂的数据挑战。
|
1天前
|
机器学习/深度学习 数据采集 算法
构建高效机器学习模型的策略与实践
【5月更文挑战第20天】 在数据驱动的时代,构建高效的机器学习模型是获取洞察力和预测未来趋势的关键。本文将探讨一系列策略和技术,旨在优化模型性能,包括数据预处理、特征工程、模型选择、超参数调优以及评估方法。我们将深入分析这些步骤如何共同作用,提升模型的泛化能力并防止过拟合。通过案例研究和最佳实践的分享,读者将获得一套实用的工具集,以应对不断变化的数据科学挑战。
|
1天前
|
机器学习/深度学习 分布式计算 数据可视化
构建高效机器学习模型的五大策略
【5月更文挑战第20天】 在数据科学迅猛发展的今天,构建高效的机器学习模型已成为众多从业者追求的目标。本文将探讨五种实用的策略,帮助读者提高其模型的性能和效率。这些策略包括特征工程的精细化操作、模型选择与调优的最佳实践、集成学习的应用、大数据处理技巧以及模型解释性与可视化的重要性。通过深入分析和案例研究,本文旨在为从业者提供一套全面的指导框架,以便在面对复杂问题时能够设计出更加健壮和精准的模型。
|
3天前
|
机器学习/深度学习 数据采集 监控
构建高效机器学习模型的最佳实践
【5月更文挑战第18天】 在数据驱动的时代,构建高效的机器学习模型已经成为企业获取竞争优势的关键。本文将深入探讨如何通过精确的数据预处理、合理的特征工程、高效的算法选择以及细致的模型调优等步骤,来提升模型的性能和预测准确度。我们还将讨论模型部署后的监控和维护策略,确保模型长期稳定运行。这些最佳实践不仅适用于初学者建立基础,也能帮助有经验的数据科学家优化现有工作流程。
|
3天前
|
机器学习/深度学习 算法 数据处理
探索机器学习中的决策树算法
【5月更文挑战第18天】探索机器学习中的决策树算法,一种基于树形结构的监督学习,常用于分类和回归。算法通过递归划分数据,选择最优特征以提高子集纯净度。优点包括直观、高效、健壮和可解释,但易过拟合、对连续数据处理不佳且不稳定。广泛应用于信贷风险评估、医疗诊断和商品推荐等领域。优化方法包括集成学习、特征工程、剪枝策略和参数调优。
|
3天前
|
机器学习/深度学习 数据采集 人工智能
【机器学习】怎样检测到线性回归模型中的过拟合?
【5月更文挑战第17天】【机器学习】怎样检测到线性回归模型中的过拟合?
|
3天前
|
机器学习/深度学习 人工智能
【机器学习】有哪些指标,可以检查回归模型是否良好地拟合了数据?
【5月更文挑战第16天】【机器学习】有哪些指标,可以检查回归模型是否良好地拟合了数据?
|
4天前
|
机器学习/深度学习 数据采集 监控
构建高效机器学习模型的策略与实践
【5月更文挑战第17天】 在当今数据驱动的时代,机器学习(ML)模型的效能成为衡量技术创新和解决实际问题能力的重要指标。本文旨在探讨构建高效机器学习模型的先进策略,并通过具体实践案例来揭示这些方法的有效性。我们将从数据处理、特征工程、模型选择、调参技巧以及模型部署等方面详细论述,旨在为读者提供一个全面而深入的视角,帮助其优化现有模型或开发新模型,以应对复杂多变的业务挑战。
11 2
|
5天前
|
机器学习/深度学习 算法 数据挖掘
【机器学习】K-means算法与PCA算法之间有什么联系?
【5月更文挑战第15天】【机器学习】K-means算法与PCA算法之间有什么联系?

相关产品

  • 人工智能平台 PAI
  • 智能语音交互