收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

通过数据取样扩展基于密度的聚类算法

范晔  周水庚  曹晶  周傲英  
【摘要】:数据聚类(clustering)是数据挖掘中是广为研究的课题之一.聚类技术在许多领域有着广泛的应用.基于密度的聚类算法(DBSCAN)是一种有效的空间聚类算法,它能发现任意形状的聚类和有效地处理噪声点(noise),并且只需用户输入一个参数.但DBSCAN算法在进行大规模空间数据库数据聚类时需要较大的内存和I/O消耗.本文在分析原有DBSCAN算法的基础上,通过数据取样来扩展DBSCAN算法,使之有效地处理大规模空间数据库.测试结果表明本文方法是有效的、可行的.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张天伍;李卫平;;一种基于密度的引力聚类算法[J];河南科学;2008年11期
2 张晓;;基于密度聚类算法的异常检测[J];伊犁师范学院学报(自然科学版);2010年04期
3 于勇前;赵相国;王国仁;陈衡岳;;一种基于密度单元的自扩展聚类算法[J];控制与决策;2006年09期
4 王贞化;焦东杰;;一种基于密度的无监督聚类算法[J];新乡学院学报(自然科学版);2010年06期
5 刘大任;孙焕良;牛志成;朱叶丽;;一种新的基于密度的聚类与孤立点检测算法[J];沈阳建筑大学学报(自然科学版);2006年01期
6 田地;王世卿;;数据挖掘中基于密度和距离聚类算法设计[J];计算机技术与发展;2006年10期
7 郑国荣;张邦礼;郭鹏;张颖;;聚类分析在电信消费模式中的应用[J];重庆大学学报(自然科学版);2006年04期
8 王洪春;彭宏;;一种基于主成分分析的异常点挖掘方法[J];计算机科学;2007年10期
9 陈敏;高学东;;并行DBSCAN聚类算法[J];中国管理信息化;2010年05期
10 夏师;梁碧珍;陆月然;罗明山;;聚类分析研究进展[J];现代计算机(专业版);2009年03期
11 赵大伟;肖周芳;;一种改进的基于密度和样本数量的K-means算法[J];科技信息;2008年28期
12 薛丽香;邱保志;;基于密度可达的多密度聚类算法[J];计算机工程;2009年17期
13 李子文;邢长征;;滑动窗口内基于密度网格的数据流聚类算法[J];计算机应用;2010年04期
14 李娜;邢长征;;时间滑动窗口内基于密度的数据流聚类算法[J];计算机应用;2011年05期
15 杨柳;钟诚;陆向艳;;基于P2P网络的分布式聚类算法研究分析[J];微电子学与计算机;2009年08期
16 米红娟;水静;;基于CLARANS算法的孤立点挖掘[J];北京电子科技学院学报;2007年04期
17 刘天元;郑志国;包海峰;;基于聚类算法的客户分析在通讯行业中的应用研究[J];长春理工大学学报(自然科学版);2007年04期
18 孟海东;杨彦侃;;并行聚类算法的设计与研究[J];计算机与现代化;2010年08期
19 张彩虹,王春才,颜雁;医保决策支持系统中的聚类算法[J];长春理工大学学报;2004年04期
20 陈磊;余建坤;邢晓宇;;谱系聚类在综合国力分析中的应用[J];云南民族大学学报(自然科学版);2009年01期
中国重要会议论文全文数据库 前10条
1 范晔;周水庚;曹晶;周傲英;;通过数据取样扩展基于密度的聚类算法[A];第十六届全国数据库学术会议论文集[C];1999年
2 娄冬梅;陈明;朱有娜;;一种基于密度的无参数聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 程尊平;周鼎;王晨;周皓峰;汪卫;施伯乐;;SDPHC——基于密度的分割和分层的自校聚类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 孙焕良;邱菲;刘俊岭;朱叶丽;;IncSNN——一种基于密度的增量聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
6 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
8 刘彤;孙永香;张振洪;;一种有效的基于密度和层次的聚类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
9 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
10 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
中国博士学位论文全文数据库 前10条
1 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
2 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
3 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
4 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
5 李强;动点聚类算法及其量子化研究[D];浙江大学;2009年
6 余卫宇;几种图像结构语义模型和图像[D];华南理工大学;2005年
7 郑永斌;物体检测技术和半定规划松弛的聚类算法研究[D];国防科学技术大学;2011年
8 胡建军;中药药理知识发现系统中关键技术的研究[D];四川大学;2006年
9 钮建伟;面向适配设计的三维人体数据多分辨率描述与聚类分析[D];清华大学;2009年
10 沈红斌;数据挖掘的建模及在生物信息学中的应用研究[D];上海交通大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘赏;结合密度思想的蚂蚁聚类算法[D];河北工业大学;2003年
2 李伟雄;基于密度的聚类算法研究[D];湖南大学;2010年
3 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
4 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
5 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
6 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
7 张驹;基于数据流的聚类算法研究与实现[D];中南大学;2009年
8 刘方;数据挖掘中半监督K-均值聚类算法的研究与改进[D];吉林大学;2010年
9 黄文江;中文文本聚类算法分析与研究[D];上海交通大学;2010年
10 杜晨阳;分布式聚类算法研究与应用[D];浙江大学;2011年
中国重要报纸全文数据库 前3条
1 国能科诺赛仕企业数据挖掘实验室 赵纪元;挖掘数据中的“宝藏”[N];中国计算机报;2001年
2 ;视频数据中挖“宝”[N];计算机世界;2002年
3 ;复杂 SAN 环境的数据管理[N];计算机世界;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978