收藏本站
《第六届全国信息检索学术会议论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于语义引力及密度分布的聚类算法

李政涛  夏树倩  王大玲  冯时  张一飞  
【摘要】:由于传统的相似性度量计算方法在数据聚类、特别是高维数据聚类过程中存在的问题,基于数据重力的相似度计算方法被引入聚类过程。针对此类方法在表达类间相似关系方面存在的不足,本文提出一种新的基于语义引力及密度分布的聚类算法。一方面,将物理学中的质量和引力等概念引入到聚类分析中,将语义引力作为数据间相似性的度量方法,不但充分考虑了数据间的几何距离可分性,而且强调了数据间属性的相关性,使其对不规则分布的样本也有较好的聚类效果;另一方面,将基于划分的聚类与基于密度的聚类方法相结合并予以改进,通过对对象密度的计算,以密度较大的对象为聚类中心进行聚类,从而降低了由于初始聚类中心选择偏差造成的影响,保证了更好的精度。实验结果表明本文提出的算法具有更准确的聚类结果,特别是在文本这样的高维、稀疏的数据中更是如此。

【相似文献】
中国期刊全文数据库 前10条
1 王志超;张磊;;具有用户特征约束的多关系聚类[J];计算机工程与应用;2011年23期
2 曾昭贤;张茂军;王炜;熊志辉;;基于样本点能量扩散模型的聚类[J];计算机应用;2011年09期
3 贺杨成;王士同;江南;;成对约束的属性加权半监督模糊核聚类算法[J];计算机工程与应用;2011年24期
4 申彦;宋顺林;朱玉全;;一种基于半监督的大规模数据集聚类算法[J];南京大学学报(自然科学版);2011年04期
5 赵杰;;基于聚类算法的硬件维护求解方法初探[J];太原城市职业技术学院学报;2011年07期
6 郝剑;高茂庭;;基于模糊相似度的RPCL文本聚类算法[J];电脑知识与技术;2011年18期
7 彭宇;罗清华;彭喜元;;UIDK-means:多维不确定性测量数据聚类算法[J];仪器仪表学报;2011年06期
8 史迎春;刘继超;;基于分类聚类技术的影视数据挖掘研究[J];软件导刊;2011年06期
9 张桂芬;;数据挖掘技术在图书馆中的应用研究[J];煤炭技术;2011年07期
10 黄韬;刘胜辉;谭艳娜;;基于k-means聚类算法的研究[J];计算机技术与发展;2011年07期
中国重要会议论文全文数据库 前10条
1 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
2 汪民乐;高晓光;李勇;;新型遗传模糊C-均值聚类算法及其在导弹目标选择中的应用[A];2007年中国智能自动化会议论文集[C];2007年
3 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
4 彭小宏;阳东升;刘忠;;基于聚类算法的组织协作网设计[A];2006中国控制与决策学术年会论文集[C];2006年
5 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
6 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
7 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
8 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
10 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国重要报纸全文数据库 前4条
1 ;视频数据中挖“宝”[N];计算机世界;2002年
2 本报记者 赵凤华 通讯员 戴世勇 陶春明;本科生登上全国学术会议讲坛[N];科技日报;2008年
3 本报记者 于翔;多元管理防范金融风险[N];网络世界;2010年
4 山东省青岛市工商局 郝虹;应重视数据资源挖掘及数据分析[N];中国工商报;2010年
中国博士学位论文全文数据库 前10条
1 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
2 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
3 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
4 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
5 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
6 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
7 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
8 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
9 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
10 李强;动点聚类算法及其量子化研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 徐丽娜;数据流中基于区间划分的高维聚类算法研究[D];燕山大学;2010年
2 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
3 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
4 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
5 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
6 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
7 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
8 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
9 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
10 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026