原文链接:http://tecdat.cn/?p=23825
本文介绍了基于有限正态混合模型在r软件中的实现,用于基于模型的聚类、分类和密度估计(点击文末“阅读原文”获取完整代码数据)。
简介
提供了通过EM算法对具有各种协方差结构的正态混合模型进行参数估计的函数,以及根据这些模型进行模拟的函数。此外,还包括将基于模型的分层聚类、混合分布估计的EM和贝叶斯信息准则(BIC)结合在一起的功能,用于聚类、密度估计和判别分析的综合策略。其他功能可用于显示和可视化拟合模型以及聚类、分类和密度估计结果。
聚类
head(X)
pairs(X)
plot(BIC)
summary(BIC)
summary(mod1, parameters = TRUE)
plot(mod1)
table(class, classification)
plot(mod1, what = "uncertainty")
clustICL(X)
summary(ICL)
BootstrapLRT(X)
初始化
使用EM算法进行最大似然估计。EM的初始化是使用从聚类层次结构聚类中获得的分区来进行的。
点击标题查阅往期内容
01
02
03
04
hclust(X, use = "SVD"))
clustBIC(X, initialization )) # 默认
hc2
clustBIC(X, initialization )
hclust(X, model= "EEE"))
summary(BIC3)
通过合并最佳结果来更新BIC。
BIC(BIC1, BIC2, BIC3)
使用随机起点进行单变量拟合,通过创建随机集聚和合并最佳结果获得。
for(j in 1:20) { rBIC <- mclustBIC( initi )) BIC <- update(BIC, rBIC) }
clust(ga, BIC)
分类
EDDA
X <- iris\[,1:4\]
head(X)
clustDA(X, class, "EDDA")
plot(mod2)
MclustDA
table(class)
head(X)
clustDA(X, class)
plot(mod3, 2)
plot(mod3, 3)
r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化(下):https://developer.aliyun.com/article/1495338