层次聚类与K-Means怎样结合运用

1、层次聚类与K-Means聚类对比
聚类分析可以用于对样本进行细分,也可以对变量进行聚类。每种聚类方法又可以分为不同的类别。
比较常见的聚类分析方法有:K-means聚类、层次聚类
K-means聚类,最大的特点就是可以快速处理大量数据,但其仅能处理定量数据而不能处理分类数据,并且K-means聚类需要自主设定聚类类别的数量,不能自动寻找最优聚类类别数量,可能导致结果质量不稳定。
层次聚类,又叫系统聚类,基本思路是将多个样本各作为一类,计算样本两两之间的距离,合并距离最近的两类成新的一类,然后再计算距离,再合并,直到只有一类为止。层次聚类可以处理分类数据和定量数据,但处理速度相对较慢,通常情况下需要结合相关结果进行主观判断聚类类别数量。
层次聚类与K-Means怎样结合运用

两种聚类方法的比较2、使用场景
如果说按是按样本(或个案)聚类,样本数据量比较大,一般使用处理速度快的K-means聚类方法
层次聚类与K-Means怎样结合运用

SPSSAU中的K-means聚类如果是按变量(或标题)聚类,此类聚类的代表是层次聚类,层次聚类会生成聚类树状图,可以直观看到聚类结果,可结合专业知识综合判定分析。
层次聚类与K-Means怎样结合运用

分层聚类3、层次聚类与K-Means结合运用
由于K-means聚类需要自己设定聚类个数,设置的太多或太少都可能影响聚类效果,而层次聚类可以自动聚类类别数量,不需要事先设定聚类个数,因此有时也会将K-means聚类和层次聚类结合起来使用。
两种方法都可以在SPSSAU(在线SPSS)中使用,有需要可以登录SPSSAU官网使用,还有案例数据可供操作学习。
层次聚类与K-Means怎样结合运用

层次聚类与K-Means怎样结合运用

相关资料SPSS在线_SPSSAU_分层聚类
【层次聚类与K-Means怎样结合运用】 SPSS在线_SPSSAU_SPSS聚类分析

■网友
先用层次聚类算法然后用K平均的聚类,是一种常见的聚类算法,好像叫什么H-K算法,这个算法有很多的拓展算法,其基本原理在于,用层次聚类算法得到信息的初始化信息,比如可以分成多少个簇,中心点的位置信息等等,这样接下来可以利用这些信息来做Kmens聚类。这样的好处是可以解决Kmeans算法初始中心位置的随机性而且可以减少运算量,因为层次聚类的算法运算量太大无法运用于大规模数据。具体可以查询一些论文,我估计有很多优化后的HK聚类算法。
■网友
实际操作中肯定是先用K-means, 因为K-means是快速聚类,他能处理大数据。层次聚类迭代次数多,对大数据束手无策,如果抽样30w,层次聚类也很吃力。用K-means聚类后的类作为观测,再进行层次聚类。


    推荐阅读