收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于领域知识的网页筛选系统

韩近强  赵静  杨冬青  唐世渭  姚小波  
【摘要】:正1.引言随着Internet技术的迅速发展,Web已经成为了主要的信息来源。目前的Web上的数据主要是以HTML网页形式存在的。如何从已知的HTML中提取有用的信息成为当前的一个研究方向。COMMIX系统中的Wrapper就是这样一个系统。它按照预先定义好的模板来提取网页信息并储存为XML文件。一方面并不是所有的网页都是可以用来进行提取的,所以我们只关心信息完全的那类网页;另一

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴方余;蒋崯崯;;网络舆情巡查系统的设计与实现[J];计算机时代;2011年08期
2 蒋国瑞;王秋利;;基于本体的TBT电子信息产品领域主题爬虫研究[J];情报杂志;2011年07期
3 陈淼;;基于数据包分析的网页还原技术研究[J];中国科技信息;2011年16期
4 王静;刘观宁;张钰辉;;网页去重的改进算法[J];微型机与应用;2011年12期
5 虞欣平;董海量;;一种实用的网络舆情监控系统[J];福建电脑;2011年06期
6 朱雪莲;;专用Web信息收集系统的设计和实现[J];煤炭技术;2011年08期
7 王博;;浅析网页设计的艺术性[J];黑龙江科技信息;2011年17期
8 贾永胜;吕秀鉴;;一维数组与数据库技术结合实现网页数据加密[J];硅谷;2011年14期
9 薛伟莲;王蕴慧;;一种基于对话的电子商务推荐系统[J];辽宁师范大学学报(自然科学版);2011年02期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 吴倩;杨逍;张兆心;;基于视觉特征的网页信息提取[A];第六届全国信息检索学术会议论文集[C];2010年
3 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 何平;李锦;;基于Web挖掘技术的用户模糊偏好分析[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 黄华军;王保卫;孙星明;;基于CSS类选择符重复引入的网页信息隐藏算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
6 孙静;刘正捷;奚小玲;王慧;;帮助盲人理解网页信息的一种网页结构划分方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
8 杨高峰;杨岳湘;;基于RSS的个性化科技信息聚合门户的设计与实现[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
9 黄锦辉;任永杰;孟小锋;;Chiql在因特网上的应用[A];第十五届全国数据库学术会议论文集[C];1998年
10 梁勇;张文;;网络舆情采集系统的设计[A];2011年全国通信安全学术会议论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
2 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
3 黄华军;网页信息隐藏与隐秘信息检测研究[D];湖南大学;2007年
4 余伟;基于用户个性挖掘的Web社区营销研究[D];武汉大学;2011年
5 胡俊;在线社会网络上SPAM行为检测方法研究[D];华中科技大学;2011年
6 费玉莲;面向电子商务的谈判支持系统研究[D];浙江工商大学;2011年
7 王永;在线广告网络的评估与优化[D];电子科技大学;2011年
8 周竹荣;基于语义的教学网格门户研究[D];西南大学;2008年
9 刘兰;网络安全事件管理关键技术研究[D];华中科技大学;2007年
10 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 于洪波;中文网页自动采集与分类系统设计与实现[D];北京邮电大学;2010年
2 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
3 冯明远;深度网络信息爬取关键技术研究与实现[D];浙江大学;2010年
4 邓科;智能搜索中的中文网页分类研究[D];兰州理工大学;2011年
5 沈洲;基于用户访问意图的网页动态建模技术的研究[D];东北大学;2008年
6 马伟瑜;基于改进的PageRank的网页信息可信度评估方法研究[D];河北大学;2011年
7 李霞;文本过滤防火墙技术研究[D];北方工业大学;2011年
8 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年
9 买买提依明·哈斯木;基于后缀树的维吾尔文网页聚类算法的设计与实现[D];新疆大学;2011年
10 张晓彦;网页信息隐藏算法研究及应用[D];北京化工大学;2010年
中国重要报纸全文数据库 前10条
1 壮壮;批量保存网页信息[N];电脑报;2004年
2 路人甲;请个专家来贴图[N];电脑报;2005年
3 钱鹏;网尽Web页中的好东东[N];电脑报;2004年
4 江苏 肖敏浩;IE中缓存的设置[N];电脑报;2001年
5 湖北 文武;详解缓存[N];中国电脑教育报;2001年
6 劲风;你的电子邮件需要保密吗[N];中国电脑教育报;2003年
7 于发修;寻找搜索的技巧[N];中国计算机报;2001年
8 张;英汉双向翻译[N];中国计算机报;2001年
9 中国科学院研究生院信息安全国家重点实验室 刘亮 徐海波 中软股份有限公司 尚铭;互联网的“海岸警卫队”[N];计算机世界;2004年
10 ;263客服中心五种方式同时接入[N];中国计算机报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978