收藏本站
《第26届中国数据库学术会议论文集(B辑)》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于网页质量的PageRank算法改进

陈小飞  王轶彤  冯小军  
【摘要】:随着Web技术的发展和Web上越来越多的各种信息,如何提供高质量、相关的查询结果成为当前Web搜索引擎的一个巨大挑战.PageRank和HITS是两个最重要的基于链接的排序算法并在商业搜索引擎中使用.然而,在PageRank算法中,每个网页的PR值被平均地分配到它所指向的所有网页,网页之间的质量差异被完全忽略.这样的算法很容易被当前的Web SPAM攻击.基于这样的认识,提出了一个关于PageRank算法的改进,称为Page Quality Based PageRank(QPR)算法.QPR算法动态地评估每个网页的质量,并根据网页的质量对每个网页的PR值做相应公平的分配.在多个不同特性的数据集上进行了全面的实验,实验结果显示,提出的QPR算法能大大提高查询结果的排序,并能有效减轻SPAM网页对查询结果的影响.
【作者单位】:复旦大学计算机科学技术学院
【基金】:国家自然科学基金项目(60603042)
【分类号】:TP393.092

【相似文献】
中国期刊全文数据库 前10条
1 吴江;使用超链分析技术的搜索引擎[J];图书情报工作;2004年07期
2 姜博;;网页PageRank算法分析及主题相关性的改进策略[J];中国科技信息;2010年22期
3 王玉珍;;Google的PageRank技术分析[J];电脑学习;2007年05期
4 宋聚平,王永成,尹中航,滕伟;对网页PageRank算法的改进[J];上海交通大学学报;2003年03期
5 余锦,史树明;分布式网页排序算法及其传输模式分析[J];计算机工程与应用;2004年29期
6 杨炳儒,李岩,陈新中,王霞;Web结构挖掘[J];计算机工程;2003年20期
7 李吉平;吴陈;曾庆军;;基于转移概率的PageRank算法研究[J];科学技术与工程;2008年08期
8 张毅;张冬梅;;搜索引擎PageRank算法的比较与改进[J];科技创新导报;2008年21期
9 王梅;;搜索引擎中的web链接算法研究与改进[J];电脑知识与技术;2009年24期
10 陈谦;;PageRank算法在孤立点检测中的应用[J];微型机与应用;2010年24期
中国重要会议论文全文数据库 前10条
1 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 白清源;林锦贤;谢丽聪;;信息自动获取系统的研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
4 冯艳卉;洪宇;颜振祥;姚建民;朱巧明;;基于搜索引擎的双语混合网页识别新方法[A];第六届全国信息检索学术会议论文集[C];2010年
5 江志纲;丁增喜;刘洋;王大玲;鲍玉斌;于戈;;基于面向属性规约方法的网页和超链的分类[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
6 孔辉;梁洪亮;辛阳;杨义先;陈林顺;;一种高性能的网页篡改检测与恢复机制[A];2010年全国通信安全学术会议论文集[C];2010年
7 蔺继国;徐锡山;;一种基于用户点击数据的个性化PageRank算法[A];第六届全国信息检索学术会议论文集[C];2010年
8 刘晖;赵萍;;新疆环境气象中心网站的总体规划及建设[A];信息技术在气象领域的开发应用论文集(一)[C];2005年
9 李立宗;高铁杠;陈蓉;陈超;;基于混沌系统的web信息隐藏研究与实现[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
10 王玉龙;叶新铭;李秀华;;网页优化策略的模糊C均值(FCM)聚类算法研究(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国重要报纸全文数据库 前10条
1 任悦采写 本报记者 方妍;照片买家说,网页繁复不招喜欢[N];中国摄影报;2009年
2 鸣涧;走近3D梦幻网页(3)[N];中国电脑教育报;2002年
3 湖南 Ringfo;防止你的网页被“偷拍”[N];电脑报;2002年
4 路人甲;在网页上圈圈点点[N];电脑报;2004年
5 湖南 郭荣辉;网页图片保存四法[N];电子报;2005年
6 鸣涧;初次握手3D网页[N];中国电脑教育报;2002年
7 李芳香;和网页垃圾说再见[N];中国电脑教育报;2002年
8 马淑芬 记者 吴岳福;宝清 率先启动“村村通网页”工程[N];黑龙江日报;2010年
9 鸣涧;网页的编辑[N];中国电脑教育报;2002年
10 辽宁 张策;滚动的字幕 滚动的网页[N];中国电脑教育报;2002年
中国博士学位论文全文数据库 前10条
1 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
2 王菁华;文本中知识的获取[D];北京邮电大学;2008年
3 覃健诚;网络多层纵深防御体系的关键技术研究[D];北京邮电大学;2011年
4 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
5 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
6 黄小广;港美经济关系研究[D];暨南大学;2008年
7 牛小飞;基于遗传规划和集成学习的Web Spam检测关键技术研究[D];山东大学;2012年
8 宣云干;基于潜在语义分析的社会化标注系统标签语义检索研究[D];南京大学;2011年
9 李方涛;基于产品评论的情感分析研究[D];清华大学;2011年
10 窦平安;电子商务语义信息共享模式[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 姜玥旭;PageRank算法的改进及在生物网络数据上的应用[D];吉林大学;2012年
2 冯静;微博用户排名机制的研究[D];燕山大学;2012年
3 云颖;复杂网络中的社区发现及进化研究[D];河北大学;2011年
4 孙学刚;面向奥运的中文网页信息获取方法的初步研究[D];清华大学;2004年
5 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
6 刘红莲;基于链接分析的搜索引擎排序算法研究[D];四川师范大学;2010年
7 张晓宇;农业网站中垃圾网页过滤方法的研究[D];新疆大学;2011年
8 杨硕;社交网页游戏现象研究[D];山东艺术学院;2012年
9 赵波;PageRank算法在非网页检索问题中的应用[D];复旦大学;2010年
10 刘先明;基于链接分析的PageRank排序算法的改进研究[D];湖北工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026