SPSS系统聚类

简介: SPSS系统聚类

前言:

本专栏参考教材为《SPSS22.0从入门到精通》,由于软件版本原因,部分内容有所改变,为适应软件版本的变化,特此创作此专栏便于大家学习。本专栏使用软件为:SPSS25.0

本专栏所有的数据文件请点击此链接下载:SPSS数据分析专栏附件


1.系统聚类

系统聚类是一种按照一定的顺序将数据点逐渐合并成聚类的方法。它不需要预先确定聚类的数目,而是通过构建聚类树或者聚类图来表示数据点的层次聚类结构,从而能够同时得到不同层次的聚类结果。系统聚类通常分为凝聚式(Agglomerative)分裂式(Divisive)两种方法,一般而言,凝聚式更为常见。

凝聚式层次聚类的基本原理是:首先将每个数据点作为一个独立的簇,然后在每一步中找到距离最近的两个簇,并将它们合并成一个新的簇,重复该过程直到满足某种停止规则为止。这样就可以形成一个聚类层次的树状结构,可以通过树状图或者树状热图来表示。这种方法通常需要计算所有数据点两两之间的距离,因而在处理大规模数据时,计算复杂度较高。

系统聚类具有以下优点:

1. 不需要预先指定聚类的数目,能够自动得到不同层次的聚类结果。

2. 能够提供丰富的聚类结构信息,例如可以展示不同层次的聚类结果和簇之间的关系。

然而,系统聚类也存在一些缺点:

1. 计算复杂度较高,特别是在处理大规模数据时需要计算两两数据点间的距离。

2. 对噪声和异常值敏感。

在实际应用中,系统聚类常常用于探索数据的内在结构、发现不同层次的聚类模式,以及辅助决策者理解数据。

2.SPSS实现

(1)打开“data10-02”数据文件,选择“分析”——“分类”——“系统聚类”,弹出下图所示的对话框。

(2)按照下图所示设置对应选项。

(3) 单击“统计”按钮,弹出“系统聚类:统计”对话框,按照下图所示设置对应选项,然后单击继续返回主对话框。

(4) 单击“方法”按钮,弹出下图所示的对话框,选项按照系统默认,单击继续。

(5) 单击“绘图”按钮,弹出“系统聚类分析:图”对话框,按照下图设置对应选项,然后单击继续返回主对话框。

(6) 单击“保存”按钮,弹出“系统聚类分析:保存”对话框,按照下图设置对应选项,然后单击继续返回主对话框。

(7)完成所有设置后,单击确定。

3.结果分析

目录
相关文章
|
1天前
|
算法 数据可视化 数据挖掘
IBM SPSS Modeler分类决策树C5.0模型分析空气污染物数据
IBM SPSS Modeler分类决策树C5.0模型分析空气污染物数据
13 4
|
4月前
|
数据挖掘 vr&ar
SPSS时间序列模型预测
SPSS时间序列模型预测
35 0
|
4月前
|
算法 数据挖掘
SPSS快速聚类
SPSS快速聚类
42 0
|
4月前
|
数据挖掘
SPSS协方差分析
SPSS协方差分析
37 0
|
4月前
|
数据挖掘
SPSS因子分析
SPSS因子分析
62 0
|
4月前
|
数据挖掘
SPSS卡方检验
SPSS卡方检验
38 0
|
4月前
|
数据挖掘
SPSS单样本t检验
SPSS单样本t检验
31 0
|
4月前
|
数据挖掘
SPSS单样本K-S检验
SPSS单样本K-S检验
33 0
|
4月前
|
数据可视化 算法 数据挖掘
SPSS多维尺度分析
SPSS多维尺度分析
69 0
|
4月前
|
数据挖掘
SPSS时间序列分析:谱分析
SPSS时间序列分析:谱分析
53 0