什么是聚类分析?聚类分析方法的类别 聚类分析法( 二 )


什么是聚类分析?聚类分析方法的类别 聚类分析法

文章插图

图3密度聚类算法示意图 。
4.基于网格的聚类方法 。基于网格的聚类方法将空量化为有限数量的单元,可以形成网格结构,所有的聚类都在网格上进行 。基本思想是将每个属性的可能值分成许多相邻的区间,并创建一组网格单元 。每个对象都属于一个网格单元,与网格单元对应的属性空包含对象的值,如图4所示 。
什么是聚类分析?聚类分析方法的类别 聚类分析法

文章插图

图4基于网格的聚类算法示意图 。
基于网格的聚类方法的主要优点是处理速度快,处理时间与数据对象的数量无关,而仅取决于量化空中每个维度的单元数量 。这类算法的缺点是只能找到水平或垂直边界的聚类,而无法检测到倾斜边界 。另外,在处理高维数据时,网格单元的数量会随着属性维数的增加呈指数级增长 。
5.基于模型的聚类方法 。基于模型的聚类方法试图优化给定数据和一些数学模型之间的适应性 。该方法假设每个集群都有一个模型,然后找到数据与给定模型的最佳匹配 。假设的模型可以是密度函数或其他表示资源网络中数据对象在空之间分布的函数 。该方法的基本资源网络原理是假设目标数据集由一系列潜在的概率分布决定 。图5比较了基于分区的聚类方法和基于模型的聚类方法 。左边给出的结果是一种基于距离的聚类方法,核心原理是对彼此接近的点进行聚类 。右侧给出了基于概率分布模型的聚类方法 。这里使用的概率分布模型是具有一定弧度的椭圆 。在图5中,标记了两个非常接近的实心点 。在基于距离的聚类方法中,它们被聚类在一个聚类中,但是在基于概率分布模型的聚类方法中,它们被分组在不同的聚类中,以满足特定的概率分布模型 。
什么是聚类分析?聚类分析方法的类别 聚类分析法

文章插图

图5资源网络中聚类方法的比较 。
在基于模型的聚类方法中,基于标准统计自动确定聚类的数量,并且还通过统计分析噪声或孤立点 。基于模型的聚类方法试图优化给定数据和某些数据模型之间的适应性 。


推荐阅读