如何理解R语言聚类算法中的密度聚类

169次阅读

共计 802 个字符，预计需要花费 3 分钟才能阅读完成。

今天就跟大家聊聊有关如何理解 R 语言聚类算法中的密度聚类，可能很多人都不太了解，为了让大家更加了解，丸趣 TV 小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

1. 原理解析:
1. 从数据集中选择一个未处理的样本点
2. 以 1 为圆心, 做半径为 E 的圆, 由于圆内圈入点的个数为 3, 满足密度阈值 Minpts, 因此称点 1 为核心对象(黑色实心圆点), 且将圈内的 4 个点形成一个簇, 其中点 1 直接密度可达周围的 3 个灰色实心原点;
3. 重复步骤 2 若干次, 其中点 1 直接密度可达核心对象 3, 且点 2 密度可达点 3.
4. 当该过程进行到图Ⅳ,4 的 E 邻域内仅有 2 个点, 小雨阈值 MinPts, 因此点 4 为边缘点(非核心对象), 记为ⓧ, 继续考察其他点.
5. 当所有对象都被考察, 该过程结束, 得到图Ⅷ. 椭圆形内有若干核心对象和边缘点, 这些点都是密度相连的.
6. 为个点归类, 如图Ⅸ: 点集黑圈相互密度可达, 属于类别 1: 点集黑三角相互密度可达, 属于新的一类, 记为类别 2; 点集白圈与类别 1 样本点密度相连, 属于类别 3; 点集白三角与类别 2 样本点密度相连, 属于类别 4; 点 ⓧ既非核心对象, 也不密度相连, 为噪声点.

2. 在 R 语言中的应用
密度聚类 (Density-based Methods) 主要应用到了 fpc 包中的 dbscan 函数。
dbscan(data,eps,MinPts=5,scale=FALSE,method=c(“hybird”,”raw”,”dist”),seeds=TRUE,showplot=FALSE,countmode=NULL)
3. 以 iris 数据集为例进行分析
1)应用模型并查看模型的相应参数
ds=dbscan(iris[,-5],eps=0.3,MinPts=4)
ds[1:length(ds)]

看完上述内容，你们对如何理解 R 语言聚类算法中的密度聚类有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注丸趣 TV 行业资讯频道，感谢大家的支持。

正文完