前言:
本专栏参考教材为《SPSS22.0从入门到精通》,由于软件版本原因,部分内容有所改变,为适应软件版本的变化,特此创作此专栏便于大家学习。本专栏使用软件为:SPSS25.0
本专栏所有的数据文件请点击此链接下载:SPSS数据分析专栏附件!
1.系统聚类
系统聚类是一种按照一定的顺序将数据点逐渐合并成聚类的方法。它不需要预先确定聚类的数目,而是通过构建聚类树或者聚类图来表示数据点的层次聚类结构,从而能够同时得到不同层次的聚类结果。系统聚类通常分为凝聚式(Agglomerative)和分裂式(Divisive)两种方法,一般而言,凝聚式更为常见。
凝聚式层次聚类的基本原理是:首先将每个数据点作为一个独立的簇,然后在每一步中找到距离最近的两个簇,并将它们合并成一个新的簇,重复该过程直到满足某种停止规则为止。这样就可以形成一个聚类层次的树状结构,可以通过树状图或者树状热图来表示。这种方法通常需要计算所有数据点两两之间的距离,因而在处理大规模数据时,计算复杂度较高。
系统聚类具有以下优点:
1. 不需要预先指定聚类的数目,能够自动得到不同层次的聚类结果。
2. 能够提供丰富的聚类结构信息,例如可以展示不同层次的聚类结果和簇之间的关系。
然而,系统聚类也存在一些缺点:
1. 计算复杂度较高,特别是在处理大规模数据时需要计算两两数据点间的距离。
2. 对噪声和异常值敏感。
在实际应用中,系统聚类常常用于探索数据的内在结构、发现不同层次的聚类模式,以及辅助决策者理解数据。
2.SPSS实现
(1)打开“data10-02”数据文件,选择“分析”——“分类”——“系统聚类”,弹出下图所示的对话框。
(2)按照下图所示设置对应选项。
(3) 单击“统计”按钮,弹出“系统聚类:统计”对话框,按照下图所示设置对应选项,然后单击继续返回主对话框。
(4) 单击“方法”按钮,弹出下图所示的对话框,选项按照系统默认,单击继续。
(5) 单击“绘图”按钮,弹出“系统聚类分析:图”对话框,按照下图设置对应选项,然后单击继续返回主对话框。
(6) 单击“保存”按钮,弹出“系统聚类分析:保存”对话框,按照下图设置对应选项,然后单击继续返回主对话框。
(7)完成所有设置后,单击确定。
3.结果分析