收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

平坦数据记录列表页的Web信息抽取

李贵  商鹏程  郑新录  韩子扬  
【摘要】:结构化信息抽取是Web内容挖掘的重要组成部分,而平坦数据记录列表页是结构化信息抽取中一种被频繁使用的网页模式。在平坦数据记录列表页构建出的DOM树的基础上,提出了一种改进的数据区域挖掘算法、数据记录识别算法,并利用部分树匹配实现目标数据的抽取,提高了目标数据项抽取过程的效率。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 陈俊彬;;Web信息抽取策略及其实现方法研究[J];科技情报开发与经济;2008年23期
2 徐中华;;Web信息抽取方法概述[J];经营管理者;2008年09期
3 谭锋;李天真;崔亮亮;;Web信息抽取系统研究综述[J];科技创新导报;2010年34期
4 蒋邵衡;;WEB信息的抽取与集成研究[J];电脑知识与技术;2009年30期
5 卢红杰;;基于Web数据的信息抽取技术[J];兰台世界;2006年07期
6 王锟;;WEB文档信息抽取方法研究[J];福建电脑;2008年03期
7 王钢明;屠建飞;;基于Web信息抽取的技术成果信息采集系统[J];成组技术与生产现代化;2007年04期
8 秦振海;谭守标;徐超;;基于Web的表格信息抽取研究[J];计算机技术与发展;2010年02期
9 李姗;黄水源;;基于XML的WEB信息抽取模型设计[J];微计算机信息;2009年09期
10 熊惠荟;欧阳君;;基于模板法的网页英语试卷自动抽取技术的研究[J];计算机与数字工程;2009年04期
中国重要会议论文全文数据库 前10条
1 李贵;商鹏程;郑新录;韩子扬;;平坦数据记录列表页的Web信息抽取[A];2010国际信息技术与应用论坛论文集[C];2010年
2 王海燕;谷明哲;王静;孟小峰;;基于预定义模式的Web信息抽取[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 胡建强;周斌;尹刚;邹鹏;;基于角色的Web服务访问控制技术研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 黄建波;丁扬;方芳;;基于代理服务器的Web加速的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
8 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
9 张秀国;郭明花;;基于进程网络的Web服务行为组合研究[A];Proceedings of 2010 International Conference on Broadcast Technology and Multimedia Communication(Volume 4)[C];2010年
10 黄胜;彭敦陆;王晓玲;周傲英;;基于与或树搜索的快速Web服务组合方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
2 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
3 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
4 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
5 胡佳;语义Web服务自动组合及验证的研究[D];天津大学;2010年
6 王辉;面向互联网的Web服务基础设施构建和应用[D];天津大学;2010年
7 宋波;Web应用交互的建模和测试用例生成[D];上海大学;2010年
8 王开宇;Web系统建模及其性能分析[D];燕山大学;2010年
9 毛一梅;基于服务质量的Web服务关键技术研究[D];东华大学;2009年
10 付晓东;Web服务组合服务质量保障关键问题研究[D];昆明理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
2 方少卿;Web就业信息抽取系统的实现研究[D];合肥工业大学;2010年
3 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
4 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年
5 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
6 朱道辉;基于条件随机域的Web信息抽取研究[D];南华大学;2010年
7 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
8 周盛强;半结构化Web信息抽取研究[D];哈尔滨工程大学;2009年
9 周浩;面向网络舆情分析的Web数据源获取关键技术研究[D];西安理工大学;2010年
10 吴佳杰;基于π-演算的Web服务事务补偿模型的研究[D];浙江师范大学;2010年
中国重要报纸全文数据库 前10条
1 赵晓涛;Web安全 服务为王[N];网络世界;2008年
2 本报特约撰稿 张娟;用Web 2.0提升知识管理效率[N];计算机世界;2008年
3 厉民;金融风暴冲击Web2.0产业[N];人民邮电;2008年
4 电脑商报记者 周雪;Web安全市场须冷却慎行[N];电脑商报;2008年
5 郭川;Web2.0:新花样层出不穷[N];人民邮电;2008年
6 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年
7 本报记者 李飞虎;Web 2.0[N];中国计算机报;2008年
8 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
9 商报记者 吴辰光;Web2.0凸显空洞概念[N];北京商报;2009年
10 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978