基于相似度线性加权方法的检索结果聚类研究
【摘要】:对检索结果的聚类能够便于用户在大量搜索结果中快速找到需要的信息,传统文本聚类技术在检索结果聚类上取得的效果并不好。Lingo算法采用LSI(潜在语义索引)对检索结果进行聚类,其首先生成候选标签,然后分配文档,形成聚类。本文提出一种在Lingo算法的基础上,融合HowNet语义相似度和余弦相似度线性加权的Single-Pass改进方法对聚类进行融合和簇再发现,并提取簇标签。该方法在聚类的纯度和F值方面均取得了较好的实验结果。
|
|
|
|
1 |
马力;;用自适应蚁群算法求解集中网站的WEB搜索优化策略[J];沈阳航空工业学院学报;2010年02期 |
2 |
淦文燕,李家福,李德毅;高维聚类中的一种特征筛选方法[J];解放军理工大学学报(自然科学版);2003年06期 |
3 |
刘宏彬,邓洪志,路松峰;聚类布尔和分类数据[J];华中科技大学学报;2001年03期 |
4 |
史延新;;基于形状特征的图像检索算法研究[J];电子科技;2008年12期 |
5 |
乔丽;姜慧霖;贾世杰;;基于改进K-means聚类的案例检索策略[J];计算机工程;2011年05期 |
6 |
李泽军;曾利军;刘文华;;基于相关性和语义相似度融合的查询扩展方法[J];计算机技术与发展;2010年09期 |
7 |
乔丽;姜慧霖;;一种k-means聚类的案例检索算法[J];计算机工程与应用;2011年04期 |
8 |
吴冬升,吴乐南,黄波;基于小波模糊聚类区域分割的图像检索[J];信号处理;2002年05期 |
9 |
张映海;何中市;陈永锋;;搜索引擎结果中Web文档的排序研究[J];计算机与数字工程;2007年02期 |
10 |
郭黎明;何艳娟;;电子商务中的协同过滤推荐系统[J];商场现代化;2009年17期 |
11 |
原福永;郭丽娜;毛伟伟;;基于内部文档比较的重排序算法[J];现代图书情报技术;2009年11期 |
12 |
王钟斐;王彪;;基于锚文本相似度的PageRank改进算法[J];计算机工程;2010年24期 |
13 |
陈建斌,宋翰涛;基于属性分布相似度的超图高维聚类算法研究[J];计算机工程与应用;2004年34期 |
14 |
夏咏梅;基于文本挖掘的分类与聚类技术[J];情报探索;2005年03期 |
15 |
李静柏;;多信息源图像的融合技术研究[J];黑龙江科技信息;2011年12期 |
16 |
范伟,宣国荣;VR系统三维建模中细节水平分割的分析[J];计算机工程;1998年01期 |
17 |
田捷,何余良,陈宏,杨鑫;一种基于相似度聚类方法的指纹识别算法[J];中国科学E辑;2005年02期 |
18 |
范自柱;;一种基于曲面求交的图像识别方法[J];计算机与信息技术;2005年03期 |
19 |
张树江;邢慧;颜景龙;;一种基于相似度的子弹识别方法[J];广西师范大学学报(自然科学版);2006年04期 |
20 |
闫英杰;林鸿飞;王剑峰;;基于混合策略的中文文摘自动评测方法[J];广西师范大学学报(自然科学版);2007年02期 |
|