收藏本站
《第六届全国信息检索学术会议论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于多分类器的Deep Web入口发现

王英  左万利  王鑫  彭涛  
【摘要】:Deep Web入口发现是Deep Web数据集成的关键问题之一,本文应用主题爬行技术和本体技术,构造网页分类器(WPC)、表单结构分类器(FSC)和表单内容分类器(FCC),实现特定领域Deep Web入口表单的自动发现。网页分类器在爬行过程中,借助主题爬行技术和本体技术进行领域内网页主题爬行;表单结构分类器对领域相关网页进行解析,并应用决策树算法判断其网页中是否存在查询接口表单,去除非搜索表单,将满足条件的表单加入表单数据库;表单内容分类器从语义方面识别特定领域Deep Web数据库入口的查询表单。最后将领域查询接口所在网页的URL地址存储到数据库中,供其它模块调用。实验结果表明,本文提出的基于多分类器的Deep Web入口发现方法是可行的。

【相似文献】
中国期刊全文数据库 前10条
1 辛洁;崔志明;赵朋朋;张广铭;鲜学丰;;基于MapReduce虚拟机的Deep Web数据源发现方法[J];通信学报;2011年07期
2 林尔东;姚志明;郑重;周旭;孙向阳;孙怡宁;;一种改进的基于地面反作用力的步态识别方法[J];模式识别与人工智能;2011年03期
3 卓林;杨舟;岳亮;赵朋朋;崔志明;;Deep Web爬虫的一种增量式更新策略[J];苏州大学学报(工科版);2011年04期
4 李明;李秀兰;;基于结果模式的Deep Web数据标注方法[J];计算机应用;2011年07期
5 杨舟;岳亮;卓林;赵朋朋;崔志明;;一种基于领域本体的Deep Web数据自动标注方法[J];苏州大学学报(工科版);2011年04期
6 邵秀丽;孙杰;侯乐彩;;基于整体模式匹配的深度网集成系统的研究[J];计算机工程与设计;2011年08期
7 董永权;李庆忠;丁艳辉;张永新;;一种基于证据理论和任务分配的Deep Web查询接口匹配方法[J];模式识别与人工智能;2011年02期
8 楼少敏;朱彦;俞晓群;;基于计算机视觉的织物疵点检测技术研究进展[J];丝绸;2011年06期
9 琚春华;陈之奇;;一种挖掘概念漂移数据流的模糊积分集成分类方法[J];山东大学学报(工学版);2011年04期
10 赵小明;朱洪波;陈黎;王亚强;秦湘清;于中华;;基于多分类器的金融领域多元关系信息抽取算法[J];计算机工程与设计;2011年07期
中国重要会议论文全文数据库 前10条
1 王英;左万利;王鑫;彭涛;;基于多分类器的Deep Web入口发现[A];第六届全国信息检索学术会议论文集[C];2010年
2 李秋华;杜鹢;任芳;;基于多分类器决策级融合的红外双波段图像目标识别[A];2009年先进光学技术及其应用研讨会论文集(上册)[C];2009年
3 余伟;李石君;洪辉;田建伟;;基于覆盖关系的Deep Web数据源排名[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
4 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 王波;王炳锡;徐毅琼;;基于多分类器的抗噪声说话人识别系统[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
6 梁浩;左万利;任斐;赫枫龄;;基于启发式信息的Deep Web查询接口属性抽取[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 王英;左万利;王鑫;彭涛;;Deep Web查询转换研究[A];第六届全国信息检索学术会议论文集[C];2010年
8 闫中敏;李庆忠;彭朝晖;董永权;丁艳辉;张永新;徐秀星;;DWDIS:面向分析的Deep Web数据集成系统[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
9 王英;左万利;彭涛;赫枫龄;彭钊;;应用领域本体知识库自动填充Deep Web入口表单[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 朱命冬;申德荣;寇月;聂铁铮;于戈;;一种应用于Deep Web环境下的重复记录识别模型[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 孔志周;多分类器系统中信息融合方法研究[D];中南大学;2011年
2 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
3 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年
4 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
5 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
6 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
7 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
8 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
9 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年
10 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 黄丹梅;多分类器系统在蛋白质功能预测方面的应用[D];吉林大学;2010年
2 欧吉顺;多分类器动态集成技术研究[D];江苏大学;2010年
3 陈文;Deep Web入口识别和个性化搜索研究与设计[D];江苏大学;2010年
4 王培正;基于Deep Web的网络信息抽取技术研究[D];华南理工大学;2010年
5 孙利;基于多分类器和双视角信息融合的乳腺钼靶图像病灶分类算法研究[D];杭州电子科技大学;2011年
6 李秀兰;基于结果模式的Deep Web语义标注研究[D];兰州理工大学;2011年
7 邓烨;面向特定领域的Deep Web数据自动抽取[D];中国海洋大学;2012年
8 张春丽;Deep Web集成查询系统预处理关键技术研究[D];大连海事大学;2012年
9 马也;Deep Web环境下查询松弛技术的研究[D];东北大学;2008年
10 蔡欣宝;Deep Web数据获取方法研究[D];苏州大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026