什么是聚类分析?聚类分析方法的类别 聚类分析法( 二 )
文章插图
图3密度聚类算法示意图 。
4.基于网格的聚类方法 。基于网格的聚类方法将空量化为有限数量的单元,可以形成网格结构,所有的聚类都在网格上进行 。基本思想是将每个属性的可能值分成许多相邻的区间,并创建一组网格单元 。每个对象都属于一个网格单元,与网格单元对应的属性空包含对象的值,如图4所示 。
文章插图
图4基于网格的聚类算法示意图 。
基于网格的聚类方法的主要优点是处理速度快,处理时间与数据对象的数量无关,而仅取决于量化空中每个维度的单元数量 。这类算法的缺点是只能找到水平或垂直边界的聚类,而无法检测到倾斜边界 。另外,在处理高维数据时,网格单元的数量会随着属性维数的增加呈指数级增长 。
5.基于模型的聚类方法 。基于模型的聚类方法试图优化给定数据和一些数学模型之间的适应性 。该方法假设每个集群都有一个模型,然后找到数据与给定模型的最佳匹配 。假设的模型可以是密度函数或其他表示资源网络中数据对象在空之间分布的函数 。该方法的基本资源网络原理是假设目标数据集由一系列潜在的概率分布决定 。图5比较了基于分区的聚类方法和基于模型的聚类方法 。左边给出的结果是一种基于距离的聚类方法,核心原理是对彼此接近的点进行聚类 。右侧给出了基于概率分布模型的聚类方法 。这里使用的概率分布模型是具有一定弧度的椭圆 。在图5中,标记了两个非常接近的实心点 。在基于距离的聚类方法中,它们被聚类在一个聚类中,但是在基于概率分布模型的聚类方法中,它们被分组在不同的聚类中,以满足特定的概率分布模型 。
文章插图
图5资源网络中聚类方法的比较 。
在基于模型的聚类方法中,基于标准统计自动确定聚类的数量,并且还通过统计分析噪声或孤立点 。基于模型的聚类方法试图优化给定数据和某些数据模型之间的适应性 。
推荐阅读
- 鱼油到底有什么作用? 鱼油软胶囊的功效与作用
- 静脉炎早期图片 脉管炎用什么药
- 人都是自作自受的结果 自作自受
- 男生烫发有几种 男生烫发
- 成语故事会——鸡犬相闻! 鸡犬相闻是什么意思
- 汪小菲|最了解汪小菲的人竟然是狗仔?葛斯齐早就说汪小菲不敢来台湾
- 密云|SKYPEOPLE天空人:冬日职场的自我表达,不是温度与风度的战争
- |姚威田静遭吐槽,田家没义务为真相负责,质疑姚威就是拉扯亲情?
- 缺铁性贫血用药如何选? 贫血吃什么药
- 唐僧缘何要西天取经? 西天取经