通过数据取样扩展基于密度的聚类算法
【摘要】:数据聚类(clustering)是数据挖掘中是广为研究的课题之一.聚类技术在许多领域有着广泛的应用.基于密度的聚类算法(DBSCAN)是一种有效的空间聚类算法,它能发现任意形状的聚类和有效地处理噪声点(noise),并且只需用户输入一个参数.但DBSCAN算法在进行大规模空间数据库数据聚类时需要较大的内存和I/O消耗.本文在分析原有DBSCAN算法的基础上,通过数据取样来扩展DBSCAN算法,使之有效地处理大规模空间数据库.测试结果表明本文方法是有效的、可行的.
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||
|