收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于相似度线性加权方法的检索结果聚类研究

刘海波  郑德权  赵铁军  
【摘要】:对检索结果的聚类能够便于用户在大量搜索结果中快速找到需要的信息,传统文本聚类技术在检索结果聚类上取得的效果并不好。Lingo算法采用LSI(潜在语义索引)对检索结果进行聚类,其首先生成候选标签,然后分配文档,形成聚类。本文提出一种在Lingo算法的基础上,融合HowNet语义相似度和余弦相似度线性加权的Single-Pass改进方法对聚类进行融合和簇再发现,并提取簇标签。该方法在聚类的纯度和F值方面均取得了较好的实验结果。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马力;;用自适应蚁群算法求解集中网站的WEB搜索优化策略[J];沈阳航空工业学院学报;2010年02期
2 淦文燕,李家福,李德毅;高维聚类中的一种特征筛选方法[J];解放军理工大学学报(自然科学版);2003年06期
3 刘宏彬,邓洪志,路松峰;聚类布尔和分类数据[J];华中科技大学学报;2001年03期
4 史延新;;基于形状特征的图像检索算法研究[J];电子科技;2008年12期
5 乔丽;姜慧霖;贾世杰;;基于改进K-means聚类的案例检索策略[J];计算机工程;2011年05期
6 李泽军;曾利军;刘文华;;基于相关性和语义相似度融合的查询扩展方法[J];计算机技术与发展;2010年09期
7 乔丽;姜慧霖;;一种k-means聚类的案例检索算法[J];计算机工程与应用;2011年04期
8 吴冬升,吴乐南,黄波;基于小波模糊聚类区域分割的图像检索[J];信号处理;2002年05期
9 张映海;何中市;陈永锋;;搜索引擎结果中Web文档的排序研究[J];计算机与数字工程;2007年02期
10 郭黎明;何艳娟;;电子商务中的协同过滤推荐系统[J];商场现代化;2009年17期
11 原福永;郭丽娜;毛伟伟;;基于内部文档比较的重排序算法[J];现代图书情报技术;2009年11期
12 王钟斐;王彪;;基于锚文本相似度的PageRank改进算法[J];计算机工程;2010年24期
13 陈建斌,宋翰涛;基于属性分布相似度的超图高维聚类算法研究[J];计算机工程与应用;2004年34期
14 夏咏梅;基于文本挖掘的分类与聚类技术[J];情报探索;2005年03期
15 李静柏;;多信息源图像的融合技术研究[J];黑龙江科技信息;2011年12期
16 范伟,宣国荣;VR系统三维建模中细节水平分割的分析[J];计算机工程;1998年01期
17 田捷,何余良,陈宏,杨鑫;一种基于相似度聚类方法的指纹识别算法[J];中国科学E辑;2005年02期
18 范自柱;;一种基于曲面求交的图像识别方法[J];计算机与信息技术;2005年03期
19 张树江;邢慧;颜景龙;;一种基于相似度的子弹识别方法[J];广西师范大学学报(自然科学版);2006年04期
20 闫英杰;林鸿飞;王剑峰;;基于混合策略的中文文摘自动评测方法[J];广西师范大学学报(自然科学版);2007年02期
中国重要会议论文全文数据库 前10条
1 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 金保华;高湘飞;柳雪环;张磊;;基于XML框架与CBR智能预案管理的研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
3 王超;许方;;一种基于奇异值分解的印刷体数字识别算法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
4 张刚;刘悦;;基于查询空间的分布式文档集合划分算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 丁海波;肖桐;朱靖波;;基于多阶段的中文人名消歧聚类技术的研究[A];第六届全国信息检索学术会议论文集[C];2010年
7 吴京慧;余珊珊;王明文;;基于用户日志聚类的查询扩展模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
9 袁里驰;钟义信;;一种新颖的词聚类算法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
10 杨广林;赵云峰;王书理;;Gabor滤波器及其在图像特征提取方面的优化算法[A];2005年中国智能自动化会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
2 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
3 肖宇;聚类分析及其在图像处理中的应用[D];北京交通大学;2012年
4 钟敏娟;基于检索结果聚类的XML伪反馈技术研究[D];江西财经大学;2012年
5 游扬声;一般分布模式下GIS位置数据的不确定性研究[D];武汉大学;2005年
6 马赓宇;基于HMM的时间序列聚类与识别[D];清华大学;2004年
7 刘建华;粒子群算法的基本理论及其改进研究[D];中南大学;2009年
8 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
9 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
10 李斌;LZ复杂性算法及其在生物序列分析中的应用研究[D];中南大学;2008年
中国硕士学位论文全文数据库 前10条
1 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
2 闵江;基于语义网的本体相似度算法研究[D];华东交通大学;2011年
3 裴运亮;基于切词和语义的中文相似度研究与应用[D];电子科技大学;2011年
4 刘冬雪;搜索引擎检索结果聚类系统的研究与实现[D];北京邮电大学;2011年
5 王斌;双层数据流聚类框架的设计与实现[D];吉林大学;2004年
6 蔡博文;高维数据集中离群数据挖掘方法的研究[D];合肥工业大学;2006年
7 于世东;多维数据可视化技术的研究及应用[D];沈阳工业大学;2006年
8 戴金;改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用[D];北京交通大学;2011年
9 孙会岭;移动环境中基于聚类的个性化推荐算法研究[D];燕山大学;2011年
10 王清江;基于力学的聚类算法[D];大连理工大学;2006年
中国重要报纸全文数据库 前10条
1 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
2 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
3 赵志荣;专题性搜索引擎[N];计算机世界;2000年
4 创智集团副总裁 胡乐群博士;数据挖掘在CRM中的应用[N];中国计算机报;2002年
5 ;视频数据中挖“宝”[N];计算机世界;2002年
6 白洁;院图书馆自动化系统检索模块的功能及应用[N];中国社会科学院院报;2005年
7 中国人民大学数据仓库与商务智能工程研究中心 $$  中国人民大学数据与知识工程研究所王珊、谢佳明、陈红、刘中蔚、邵琦洪、张宁;创建数据仓库:要面向三条路线[N];中国计算机报;2002年
8 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
9 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
10 骆卫华 刘群 张俊林;搜索引擎:性能提高遇到瓶颈[N];计算机世界;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978