收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于主题相关度的网页排序算法

吴炜  梁昆  李瑞轩  辜希武  卢正鼎  
【摘要】:针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法.通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上实现离线计算改进后的PageRank算法.理论分析和仿真实验表明,改进的PageRank算法使用户能方便地找到所需网页,提高了网页查询效率.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 关慧芬;师军;马继红;;基于遗传算法的主题爬行技术研究[J];计算机与数字工程;2008年10期
2 汪斌;张云伟;刘健;陈晶;;一种面向农业信息主题网络爬虫的设计[J];安徽农业科学;2009年20期
3 徐德智;郭渭莉;;基于本体的主题相关度算法研究[J];云南大学学报(自然科学版);2007年S1期
4 邵雄凯;梁云静;刘建舟;;基于遗传算法的主题信息搜索研究[J];网络安全技术与应用;2009年11期
5 李琳琢;;网络爬虫软件的研究与开发[J];软件导刊;2011年05期
6 王学贺;;智能主题搜索算法研究[J];江汉大学学报(自然科学版);2009年02期
7 邹永斌;陈兴蜀;王文贤;;基于贝叶斯分类器的主题爬虫研究[J];计算机应用研究;2009年09期
8 韩宇;黄青松;;基于改进PageRank的情报主题相关度预测策略[J];微型电脑应用;2010年03期
9 曾广朴;范会联;;基于遗传算法的聚焦爬虫搜索策略[J];计算机工程;2010年11期
10 王朝斌;金洪颖;赵刚;;基于本体的搜索引擎研究[J];西华师范大学学报(自然科学版);2010年04期
11 彭冬;蔡皖东;;面向Web论坛的网络信息获取技术及系统实现[J];计算机工程与科学;2011年01期
12 戚欣;;基于本体的主题网络爬虫设计[J];武汉理工大学学报;2009年03期
13 拜战胜;徐德智;彭佳红;陈光仪;;基于主题本体的信息采集模型研究[J];计算机技术与发展;2009年10期
14 金明珠;丁岳伟;;基于动态主题库的主题爬虫[J];计算机应用;2009年S2期
15 谢志妮;;一种新的基于概念树的主题网络爬虫方法[J];计算机与现代化;2010年04期
16 范会联;李献礼;曾广朴;;基于改进遗传算法的聚焦爬虫设计[J];计算机工程与科学;2010年05期
17 张敏;杜华;;垂直搜索引擎系统的设计与实现[J];情报科学;2011年03期
18 郑国良;叶飞跃;林国俊;耿冬;;基于领域本体的主题信息采集方法[J];计算机应用;2008年12期
19 欧阳柳波;杨柱;易显;;基于DIV标签树的网页主题信息抽取方法[J];计算机系统应用;2010年07期
20 汪涛,樊孝忠;主题爬虫的设计与实现[J];计算机应用;2004年S1期
中国重要会议论文全文数据库 前3条
1 吴炜;梁昆;李瑞轩;辜希武;卢正鼎;;一种基于主题相关度的网页排序算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
2 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
3 闫泼;马军;陈竹敏;;面向主题的网页排序算法研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前6条
1 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
2 曹欢欢;基于大规模搜索日志挖掘的上下文感知搜索研究[D];中国科学技术大学;2009年
3 刘玉婷;网页排序中的随机模型及算法[D];北京交通大学;2009年
4 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
5 韩晓晖;Web社会媒体中信息的质量评价及应用研究[D];山东大学;2012年
6 王琦;古代壁画的语义检索技术及应用研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 冯东庆;基于链接分析的网页排序作弊检测方法研究[D];吉林大学;2011年
2 刘文辉;基于链接结构的网页排序算法研究[D];哈尔滨工程大学;2010年
3 陈瑜芳;主题爬虫系统的研究[D];武汉理工大学;2010年
4 姜博;基于聚焦爬虫的web信息采集技术研究[D];北方工业大学;2011年
5 李正文;基于SVM分类算法的主题爬虫研究[D];哈尔滨工程大学;2011年
6 尹辉;基于Nutch的搜索系统的研究[D];电子科技大学;2008年
7 闫继钢;搜索引擎的研究与实现[D];兰州大学;2009年
8 高文梁;改进的基于历史信息分析的网页排序算法[D];大连理工大学;2009年
9 徐金雷;专业搜索引擎的排序算法研究[D];南京师范大学;2007年
10 方旭;基于链接相似度的网页排序算法研究[D];南京理工大学;2008年
中国重要报纸全文数据库 前1条
1 东方证券 陈刚 王天一 编辑 全泽源;国庆60周年大阅兵 军工板块能沾多少喜气[N];上海证券报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978