收藏本站
《全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于多链接分析的主题爬虫设计实现

刘兵  胡学钢  
【摘要】:普通的主题爬虫一般只是对页面的静态链接进行分析,而没有关注到页面中存在着大量的其它链接方式,如动态链接等,从而造成页面的查全和查准率不是很高。本文介绍了一种主题挖掘系统,系统中充分考虑了页面的各种链接,给出系统的详细设计实现。实验表明,其查全和查准率大大提高。
【作者单位】:合肥工业大学计算机与信息学院
【分类号】:TP391.3

【共引文献】
中国期刊全文数据库 前10条
1 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期
2 汪斌;张云伟;刘健;陈晶;;一种面向农业信息主题网络爬虫的设计[J];安徽农业科学;2009年20期
3 刘珊慧;万韵;杨乐;;基于本体的农业信息资源语义检索过程研究[J];安徽农业科学;2009年23期
4 廉捷;刘云;;网络舆情中的信息预处理与自动摘要算法[J];北京交通大学学报;2010年05期
5 任斌;毛应爽;;基于本体的主动学习主题爬行的研究与实现[J];长春工程学院学报(自然科学版);2011年01期
6 武昊;廖安平;何超英;侯东阳;;基于主题相关度的地理信息Web服务爬虫研究[J];地理与地理信息科学;2012年02期
7 张超;闫宏印;;多线程网络爬虫的设计与实现[J];电脑开发与应用;2012年06期
8 吴聪聪;赵建立;;基于本体的主题爬虫的研究[J];电脑知识与技术;2011年03期
9 李江;殷之明;;链接分析研究综述[J];大学图书馆学报;2008年02期
10 王迁;王丽娜;;对收费网站中作品提供链接的法律性质——评“娱乐基地”诉百度案[J];电子知识产权;2007年08期
中国重要会议论文全文数据库 前4条
1 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 王栋;陈勇;徐建良;;基于预测的BitTorrent种子评估方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
3 戴玉刚;;藏文网页采集技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
4 冯淑芳;王素格;;面向观点挖掘的汽车本体知识库的构建[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前9条
1 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
2 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 王肃;基于多Agent的突发事件信息智能监测系统研究[D];北京邮电大学;2011年
5 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年
6 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
7 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年
8 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
9 周亦鹏;基于软件人的情境主题分析及应用研究[D];北京科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
2 翁岩青;网页抓取策略研究[D];哈尔滨工程大学;2010年
3 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
4 史炜;个性化搜索引擎的研究与设计[D];电子科技大学;2010年
5 丁宝琼;网络文本信息采集分析关键技术研究与实现[D];解放军信息工程大学;2009年
6 沙有闯;基于Web文本挖掘的网络口碑监测系统研究[D];安徽大学;2010年
7 陈可钦;基于垂直搜索引擎的主题爬虫算法的研究[D];中南林业科技大学;2009年
8 张朝威;面向企业竞争情报的主题搜索研究与实现[D];西安电子科技大学;2010年
9 刘永信;主题搜索与Web挖掘的研究及系统实现[D];西安电子科技大学;2009年
10 姜博;基于聚焦爬虫的web信息采集技术研究[D];北方工业大学;2011年
【二级参考文献】
中国期刊全文数据库 前2条
1 赵焕洲,唐爱民;对两种知识组织系统——叙词表与Ontology的比较研究[J];情报理论与实践;2005年05期
2 何绍义;概念信息检索的理论与实践[J];情报学报;1995年02期
【相似文献】
中国期刊全文数据库 前10条
1 陈太洋;;我国大学图书馆网站链接的实证分析——以中国“211工程”高校为例[J];图书馆杂志;2007年03期
2 严丽丽;陈鹤年;季文天;雷景生;;基于超链接和相关度策略的克隆Web搜索方法[J];广西师范大学学报(自然科学版);2009年04期
3 刘彦祖;;Web of Science数据库中网络链接分析研究论文的定量分析[J];情报探索;2010年02期
4 苏娜;张志强;刘志辉;;基于链接分析的图林博客显著度分析[J];情报资料工作;2010年01期
5 李绍华;高文宇;;搜索引擎页面排序算法研究综述[J];计算机应用研究;2007年06期
6 郑利荣;;搜索引擎的主题提取算法研究[J];现代计算机(专业版);2008年07期
7 孙莹莹;姚文辉;;数据挖掘技术在反洗钱系统中的应用[J];华南金融电脑;2006年04期
8 李梁;罗奇鸣;陈恩红;;对象级搜索中基于图的对象排序模型(英文)[J];山东大学学报(工学版);2009年01期
9 吴茵茵;;公共图书馆的数字化网络建设与利用分析[J];农业图书情报学刊;2010年04期
10 刘菁菁;董静;林鸿飞;叶正;;基于锚文本相似度的链接算法[J];郑州大学学报(理学版);2007年02期
中国重要会议论文全文数据库 前10条
1 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
2 宋丹;林鸿飞;杨志豪;;一种利用链接分析的Web话题跟踪方法[A];第三届学生计算语言学研讨会论文集[C];2006年
3 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
4 杨宇航;赵铁军;郑德权;于浩;;基于链接分析的重要Blog信息源发现[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 张冉;卡米力毛依丁;;基于论文参考文献引用分析的专业文献查询库[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
6 杨磊;束罡;牛振东;;基于引力模型的链接分析(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 曹加恒;郑振楣;石树刚;;WJMIS的模型开发与设计实现[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年
8 吴晨;宋丹;薛德军;师庆辉;;科技主题识别及表示[A];第五届全国信息检索学术会议论文集[C];2009年
9 张明生;;基于数据挖掘的学生成绩分析系统设计与实现[A];教育技术应用与整合研究论文[C];2005年
10 申文明;梁一平;周小平;;搜索引擎的反作弊技术研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 晓轩;SOA两大关键:架构与规划[N];计算机世界;2006年
2 希安;微软试水信息检索[N];经济日报;2004年
3 艾文;BKD:更为实用的ERP[N];中国计算机报;2002年
4 陶静;科华UPS助力图书馆数字化[N];中国高新技术产业导报;2006年
5 记者 向阳;软件测试关键技术研究有望降低测试成本[N];科技日报;2009年
6 本报记者 陈栋栋;艾玛·汉斯拜尔:提供物美价廉设计软件[N];中国工业报;2009年
7 安吉;第十三届中创软件基金颁奖[N];科技日报;2008年
8 陈栋栋;欧特克三维软件引发设计革命[N];中国工业报;2009年
9 周晨;欧特克三维软件引发设计革命[N];建筑时报;2009年
10 苏中烟;江苏中烟设备图形信息资源集成系统项目通过验收[N];东方烟草报;2010年
中国博士学位论文全文数据库 前10条
1 刘洪波;INTERNET中的信息网络提取分析及Rank相关研究[D];清华大学;2007年
2 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
3 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
4 徐秀娟;商务智能中的利润挖掘研究[D];吉林大学;2008年
5 黄晋;组合横切关注自动化挖掘与重构方法研究[D];华中科技大学;2012年
6 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
7 李仁见;堆操作程序分析验证技术研究[D];国防科学技术大学;2011年
8 陈剑赟;体育视频语义内容分析技术研究[D];国防科学技术大学;2005年
9 李世胜;基于运行时的程序执行模型研究[D];中国科学技术大学;2010年
10 黄逸民;基于多Agent的智能管理信息系统理论与应用研究[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 郭坤银;基于页面分块和链接分析的Web图片检索研究[D];重庆大学;2009年
2 陈翰生;基于改进HITS算法及位置信息的关键网页信息抽取方法[D];复旦大学;2009年
3 付克志;基于Web的文本信息检索算法的研究[D];大连理工大学;2006年
4 李峰;基于博客特性和链接分析的博客搜索结果排序算法研究[D];浙江大学;2008年
5 宋丹;基于语义和链接的话题跟踪方法[D];大连理工大学;2007年
6 李翠;基于链接分析的Web社区发现研究与应用[D];西安理工大学;2007年
7 张利国;基于引力模型的链接分析算法研究[D];大连理工大学;2007年
8 刘菁菁;基于结构和主题的Web信息检索研究[D];大连理工大学;2007年
9 方旭;基于链接相似度的网页排序算法研究[D];南京理工大学;2008年
10 黄英华;面向链接分析的数据仓库及联机分析处理系统的研究与应用[D];北京邮电大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026