收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于数据分布差异度的子空间聚类算法

徐玉峰  周丽华  肖清  
【摘要】:随着聚类技术应用范围的不断扩大,传统的聚类方法已不能满足对高维数据的分析要求。对高维数据的聚类分析,要求算法不仅要发现簇,而且还要发现存在簇的子空间。使用子空间聚类策略,通过数据分布差异度的概念来描述子空间上数据分布的密集性,提出了一种新的子空间聚类算法SCDDD。该算法能够满足对高维数据的聚类分析要求,而且能够发现任意形状的簇。实验结果表明算法的聚类精度较高,算法时间随相关维度的增加基本呈线性增长。最后将SCDDD算法应用于一个真实的数据集Food,我们发现了有趣的簇和存在这些簇的子空间。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 小凡;风儿;;图说IT之二 舌战预算会[J];IT经理世界;2006年09期
2 郑胜;郝毫毫;;基于贝努利大数定律的数据分布算法[J];计算机工程;2009年19期
3 周虎成,黄春,赵克佳;编译器指导的OpenMP Fortran程序数据分布[J];南京大学学报(自然科学版);2005年05期
4 董春丽;赵荣彩;韩林;张亚;;一种具有重排通信的数据分布策略[J];计算机应用研究;2007年07期
5 朱丽丽;;分布式数据库在高校的应用策略[J];科技信息(科学教研);2008年17期
6 韩林;赵荣彩;庞建民;;基于线性变换的计算与数据动态分解方法[J];计算机工程;2008年15期
7 刘雅辉;李也白;;分布式数据库在高校信息化建设中的应用[J];计算机与网络;2008年Z1期
8 陈桂琴;倪娜;;可靠性试验中的数据MATLAB分析法研究[J];电脑编程技巧与维护;2009年18期
9 曹庆芬,翁惠玉;一个集中分布式事务处理系统的数据分布策略[J];计算机工程与应用;1997年01期
10 陈楠;;分布式数据库系统的数据分布策略及其应用[J];石油工业计算机应用;1998年04期
11 吴润秀,孙辉;双权复杂网络数据分布优化策略[J];南昌水专学报;2003年02期
12 杜奕,卢德唐,许卫;一种基于流数据统计的加权组合预估算法[J];计算机与现代化;2005年08期
13 董春丽 ,张平 ,韩林 ,林红军;自动计算分解和数据划分算法研究[J];微计算机信息;2005年23期
14 卢威;陈继明;徐晓旸;潘金贵;;分布式虚拟环境AIMNET的关键技术概述[J];计算机科学;2006年11期
15 张文宇;;数据挖掘过程中连续属性离散化新方法研究[J];数学的实践与认识;2007年10期
16 彭华林;;分布式数据库在高校的应用策略[J];大众科技;2007年01期
17 黄一新;;森林防火指挥系统中分布式数据库系统设计探索[J];福建电脑;2008年11期
18 王晖,胡宝成,何华灿,王忠,沈绪榜;LS MPP数据并行C语言编译器实现的研究[J];微电子学与计算机;2000年06期
19 侯素新,陈焜;分布式数据库技术在图书资料管理系统中的应用[J];江汉大学学报(自然科学版);2005年03期
20 武继刚,庞淑萍;堆上的数据分布与堆选择算法[J];计算技术与自动化;1995年04期
中国重要会议论文全文数据库 前10条
1 徐玉峰;周丽华;肖清;;一种基于数据分布差异度的子空间聚类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
2 陈楠;;分布式数据库系统的数据分布策略研究[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
3 罗晓娟;袁占亭;张秋余;冯涛;余政;;管理信息系统中数据分布策略的探讨[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
4 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
5 胥永康;岳筱玲;潘泽友;;基于数据分布的劳动力市场信息系统[A];第六届全国计算机应用联合学术会议论文集[C];2002年
6 周晓云;孙志挥;张柏礼;胡文瑜;;一种基于单调递减阈值函数的高维数据集聚类算法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 庄传志;张道强;;多视角判别聚类算法[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
8 孙焕良;赵法信;鲍玉斌;于戈;王大玲;;CD-Stream——一种基于空间划分的流数据密度聚类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 孙浩军;孔令俊;刘志辉;;利用高斯分布生成数据对聚类算法的比较[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
10 娄冬梅;陈明;朱有娜;;一种基于密度的无参数聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 胡勇其;基于语义的数据对象访问和存储管理研究[D];中国科学院研究生院(计算技术研究所);2006年
2 李旭;系统级数据保护技术研究[D];华中科技大学;2008年
3 金文梁;三维复子空间中的量子搜索和多相位匹配研究[D];西南交通大学;2011年
4 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
5 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
6 彭柳青;高维高噪声数据聚类中关键问题研究[D];西安电子科技大学;2011年
7 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
8 任继成;三维数据场并行体绘制技术及可视化系统的研究与实现[D];中国科学院研究生院(计算技术研究所);1999年
9 张平;并行化编译器中并行程序自动生成和性能优化技术研究[D];解放军信息工程大学;2006年
10 周红福;基于索引的Skyline算法研究[D];复旦大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘柏辉;黑龙江省有奖发票管理系统[D];哈尔滨理工大学;2005年
2 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
3 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
4 何青松;基于隐私保护的分布式聚类算法的研究[D];复旦大学;2010年
5 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
6 杜育林;基于信息熵的高维分类型数据子空间聚类算法研究[D];汕头大学;2011年
7 王慧玉;基于分布式数据库系统查询优化的研究与应用[D];大连海事大学;2005年
8 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
9 刘之岗;基于有效维选择的子空间聚类算法研究[D];燕山大学;2012年
10 刘赏;结合密度思想的蚂蚁聚类算法[D];河北工业大学;2003年
中国重要报纸全文数据库 前10条
1 神州数码融信软件有限公司 黄军万;用IT总体架构提升企业综合竞争力[N];中国计算机报;2007年
2 刘国民;Sybase ASE表分区的使用[N];计算机世界;2003年
3 周文林;“云计算”将取代传统计算模式[N];中国税务报;2008年
4 于露;谷歌CEO来华与众高校合作推“云计算”[N];电子资讯时报;2008年
5 本报记者 郭平;沃森背后的秘密[N];计算机世界;2011年
6 ;从信息孤岛中抓出决策支持数据[N];计算机世界;2004年
7 ;商业智能应用软件产品展示[N];中国计算机报;2002年
8 余海玲;金山软件成立实验室探索前沿技术[N];中国改革报;2007年
9 ;飞康远程办公与异地灾备解决方案[N];计算机世界;2007年
10 高月;让数据围着银行转[N];计算机世界;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978