收藏本站
《2008'中国信息技术与应用学术论坛论文集(一)》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

Web表格信息抽取技术的研究

袁鸿雁  
【摘要】:互联网上有大量信息采用 HTML 表格表示,由于 HTML 不描述数据的内容,机器不能理解和查询。论文利用 HTML 表格属性,定位表格,提取出识别真假表格的特征信息,结合应用本体形成启发式规则,在此基础上对表格结构识别进行了分析,最后实现基于应用本体对表格数据进行抽取。
【作者单位】:沈阳职业技术学院
【分类号】:TP391.1

【共引文献】
中国期刊全文数据库 前6条
1 袁鸿雁;;基于本体的HTML表格识别技术的研究[J];长春工程学院学报(自然科学版);2010年01期
2 袁鸿雁;;基于本体的Web表格信息抽取技术的研究[J];青岛大学学报(自然科学版);2010年02期
3 何普亮;;多媒体课件自动生成系统的设计与实现[J];软件导刊(教育技术);2008年10期
4 帖晶;方庆安;;一种基于线性回归的非结构化WEB服务识别方法[J];软件;2011年05期
5 周二虎;张水平;胡洋;;基于Deep Web检索的查询结果处理技术的应用[J];计算机工程与设计;2010年01期
6 蔡李;单艳;薛化建;苏国平;;维吾尔文网页正文抽取系统的研究与实现[J];计算机工程与设计;2012年02期
中国重要会议论文全文数据库 前1条
1 丁政建;张路;;基于本体的语义检索研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国博士学位论文全文数据库 前4条
1 赵朋朋;Deep Web信息集成若干关键技术研究[D];苏州大学;2008年
2 方巍;基于本体的Deep Web信息集成关键技术研究[D];苏州大学;2009年
3 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
4 丁艳辉;面向Web数据集成的数据抽取问题研究[D];山东大学;2010年
中国硕士学位论文全文数据库 前10条
1 高永胜;基于树形结构的网页数据抽取模式研究及应用[D];大连理工大学;2011年
2 解涛;精确Web信息抽取集成模型与关键技术研究[D];南京大学;2011年
3 罗伟;Web数据集成中包装器自适应方法研究[D];山东大学;2011年
4 徐秀星;Web数据集成中全局模式构建方法研究[D];山东大学;2011年
5 邓蓉;基于本体的深度搜索系统关键词库的构造与研究[D];江西师范大学;2011年
6 周炘;面向电子商务网站的深度搜索与信息抽取研究[D];江西师范大学;2011年
7 阚述贤;基于本体及概念模式的Deep Web查询结果处理技术[D];广西师范大学;2011年
8 陈尚安;林业企业黄页Deep Web数据集成研究[D];北京林业大学;2012年
9 卓林;增量式Deep Web数据获取技术研究[D];苏州大学;2011年
10 连璐;WEB主题信息采集系统的设计与实现[D];电子科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前1条
1 欧健文,董守斌,蔡斌;模板化网页主题信息的提取方法[J];清华大学学报(自然科学版);2005年S1期
【相似文献】
中国期刊全文数据库 前10条
1 袁鸿雁;;基于本体的HTML表格识别技术的研究[J];长春工程学院学报(自然科学版);2010年01期
2 张群会;表格数据自动识别技术研究[J];西安科技学院学报;2000年04期
3 李清泉,谢智颖,左小清,王冲;基于SVG的空间信息描述与可视化表达[J];测绘学报;2005年01期
4 葛宇;;分栏Word表格,全方位看齐![J];电脑爱好者;2008年11期
5 葛宇;;表格属性中的三种暗器[J];电脑知识与技术(经验技巧);2008年01期
6 刘真,吴泉源;非限定表格信息提取系统的研究[J];计算机学报;1995年11期
7 贺岩,崔喆;基于加权无向图的表格分割方法[J];计算机应用;2004年S1期
8 李朝;彭宏;叶苏南;张欢;杨亲遥;;基于DOM树的可适应性Web信息抽取[J];计算机科学;2009年07期
9 刘真,吴泉源;通用表格处理系统中定位方法的研究[J];软件学报;1996年07期
10 张晶;陈褔生;;知识管理中的基于XML的知识存储[J];计算机应用研究;2006年01期
中国重要会议论文全文数据库 前5条
1 袁鸿雁;;Web表格信息抽取技术的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
2 王英奎;潘无名;李孝文;谭钱茂;;一种基于DOM树的Web信息提取方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
3 赵姗;李宏伟;蓝士斌;;VC环境下利用DOM存取WebGIS中XML格式地图数据[A];中国地理信息系统协会第八届年会论文集[C];2004年
4 仲跻亮;甘仞初;;基于SOAP消息的数据库对LDAP目录的数据更新研究[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
5 陈刚;高翔;许继恒;;仿真数据库系统开发[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
中国重要报纸全文数据库 前7条
1 赵江;Dreamweaver MX 2004从零开始(二)[N];中国电脑教育报;2003年
2 北京邮电大学 张剑;XML的显示——XSL样式单(上)[N];计算机世界;2001年
3 清华大学 李骅竞 邢春晓 张志强;NXDB与XEDB殊途同归[N];计算机世界;2003年
4 小羽;美化网页好帮手[N];中国电脑教育报;2002年
5 世纪鸟作坊 何勇平;网页图像效果[N];电脑报;2001年
6 ;汉王OCR金融行业解决方案[N];中国计算机报;2002年
7 上海 孟庆国;用Word套打凭证封面[N];电脑报;2004年
中国硕士学位论文全文数据库 前10条
1 刘建华;基于关系数据库的XML存储查询系统设计[D];合肥工业大学;2004年
2 李知颖;基于包装器模型的信息抽取算法研究[D];东北师范大学;2009年
3 陈佳;基于XML的Web信息抽取技术的应用研究[D];武汉理工大学;2007年
4 史西兵;基于XML的Web信息抽取技术研究[D];西北大学;2008年
5 刘秋水;Web信息抽取与网页摘要的研究与应用[D];大连理工大学;2008年
6 邱亚娜;信息化教育领域的Web信息抽取技术研究[D];天津师范大学;2008年
7 王实;垂直搜索引擎中的网页对象抽取模型及实现技术研究[D];湖南大学;2009年
8 陈涛;基于网页关联特征的互联网图像自动标注系统[D];浙江大学;2007年
9 董之茵;网页信息提取与净化的研究[D];吉林大学;2008年
10 岳欢;XML文档在关系数据库中存储方案的研究[D];重庆大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026