收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于链接的分布式信息检索文档划分研究

张刚  王斌  程学旗  
【摘要】:文档集合的划分是分布式信息检索面临的一个重要问题,本文提出了一种基于链接的聚类算法(LIBCA)来进行分布式信息检索的文档划分,LIBCA算法利用网页间的链接关系来计算网页与网页、网页与网页集合之间的相似度,从而利用聚类技术实现对数据集合的划分。实验表明,按照LIBCA 算法进行文档集合划分,排名前10位的文档集合含有的相关文档数占相关文档总数的80-90%,相对于随机的划分方法提高了20-30%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马程;;空间聚类研究[J];计算机技术与发展;2009年04期
2 秦亮曦;刘新峰;史忠植;;基于片段模式的多时间序列关联分析[J];计算机科学;2006年01期
3 苏令华;吕韶昱;万建伟;;基于多预测器的高光谱图像无损压缩[J];国防科技大学学报;2007年01期
4 连玮;梁彦;潘泉;程咏梅;张洪才;;用于特征点配准的快速聚类凸集投影算法[J];自动化学报;2007年03期
5 唐槐璐;须文波;龙海侠;;基于AQPSO的数据聚类[J];计算机工程与应用;2007年10期
6 洪联系;董绍华;;MDVRPTW问题多阶段迭代启发式算法[J];计算机工程与应用;2007年26期
7 程舒通;徐从富;但红卫;;频繁模式聚类算法改进研究[J];计算机工程与应用;2008年01期
8 李云;田素方;李拓;徐涛;;基于概念格的Web文本聚类[J];计算机工程与应用;2008年23期
9 刘怀强;;视频序列中运动目标影子去除方法[J];科技信息;2008年30期
10 徐玮;张茂军;王炜;熊志辉;;基于群体智能的基础矩阵估计算法[J];系统仿真学报;2008年22期
11 罗晓丽;郭绍忠;陈新;;采用服务聚类的语义服务发现[J];信息工程大学学报;2009年03期
12 柳佳刚;曾利军;;基于PAT-tree的中文搜索引擎结果聚类算法[J];情报杂志;2009年12期
13 宋晓宇;刘锋;孙焕良;;基于粗糙集的聚类算法中阈值自动选取[J];系统工程与电子技术;2010年01期
14 郑世明;徐顺福;宋自林;苗壮;;网格环境下基于Weka4WS的分布式聚类算法[J];计算机应用研究;2010年11期
15 王春腾;符传谊;邢洁清;;基于非负约束的谱聚类方法[J];电脑知识与技术;2011年17期
16 苏孝强;倪宏;;一种基于空间相依性的移动对象聚类算法[J];微计算机应用;2011年05期
17 林川;潘盛辉;谭光兴;李梦和;;基于聚类与链码技术的交通标志检测[J];计算机测量与控制;2011年06期
18 郑燕玲;;一种基于信息熵的空间聚类算法[J];微电子学与计算机;2011年08期
19 马煜;陈莉;欧立奇;;基因微阵列数据的聚类分析算法研究[J];计算机工程与应用;2006年05期
20 冯征;;一种基于粗糙集的K-Means聚类算法[J];计算机工程与应用;2006年20期
中国重要会议论文全文数据库 前10条
1 张刚;王斌;程学旗;;基于链接的分布式信息检索文档划分研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 张健;叶建栲;李广斌;;基于代表点的聚类算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 杨勰;刘群;吴渝;;基于聚类算法的粒子系统模拟实现[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
4 高冠东;贾克斌;肖珂;;一种新的基于特征点匹配的图像拼接方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
5 马垣;张红云;李晓瑞;刘刚;张小平;马文胜;;关系数据库中基于拓扑空间的聚类方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 朱琳;周水庚;;基于聚类的文本分类属性加权[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
7 冯红伟;李战怀;;一种基于相似性的时间序列聚类方法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 丁国辉;王国仁;赵宇海;;基于使用信息和聚类方法的多模式集成[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
9 褚静波;王轶彤;汪卫;;一种有效的自动识别与过滤噪链的方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 李丽娜;基于链接的网络数据分类和链接预测新方法研究[D];吉林大学;2012年
2 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
3 钮建伟;面向适配设计的三维人体数据多分辨率描述与聚类分析[D];清华大学;2009年
4 王勇;基于流形学习的分类与聚类方法及其应用研究[D];国防科学技术大学;2011年
5 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
6 吴科;基于机器学习的文本分类研究[D];上海交通大学;2008年
7 胡雅婷;可能性聚类方法研究及应用[D];吉林大学;2012年
8 刘建伟;流数据查询系统结构及模式查询算法的研究[D];东华大学;2005年
9 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
10 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 盛文峰;面向数据挖掘的遗传算法的研究与应用[D];上海交通大学;2007年
2 伊莉娜;基于Agent的移动查询技术研究[D];哈尔滨理工大学;2008年
3 李国宇;基于J2EE的数据挖掘系统的构建及聚类技术研究[D];天津大学;2007年
4 金燕;多时间序列数据流聚类算法研究[D];国防科学技术大学;2007年
5 李敏;基于网格和密度的数据流聚类算法研究[D];武汉理工大学;2009年
6 司学锋;基于聚类的BP神经网络在织物染色计算机配色中的应用研究[D];青岛大学;2009年
7 崔天意;舰艇装备软件可靠性测试方法及预测研究[D];哈尔滨工程大学;2008年
8 王新波;基于OAI-PMH协议的元数据聚类算法及应用研究[D];太原科技大学;2009年
9 李雪;不确定数据聚类研究[D];大连理工大学;2009年
10 陈壮;基于聚类方法的数据挖掘在人口信息系统中的研究和应用[D];浙江大学;2006年
中国重要报纸全文数据库 前10条
1 钱留宽;乡镇零户统管操作技巧[N];中国财经报;2008年
2 本报记者 贾婧;书生SEP:全面e化传统纸张[N];科技日报;2006年
3 朱静芬;Excel在财务中的运用[N];财会信报;2007年
4 北京大学 王万平;支持质量保证的协同开发环境[N];中国计算机报;2007年
5 寿栋芯语;揭开企业搜索的技术面纱[N];计算机世界;2008年
6 四川 刘昌松;用Excel合并会计报表[N];电脑报;2001年
7 陈艳;SA方法自动化[N];中国电脑教育报;2003年
8 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;“海”中捞“珍”[N];计算机世界;2003年
9 北京中电华大电子设计有限 责任公司 侯劲松 张萍 李志梁 刘伟平;版图验证的应用及发展[N];计算机世界;2005年
10 骆卫华 刘群 张俊林;搜索引擎:性能提高遇到瓶颈[N];计算机世界;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978