收藏本站
收藏 | 论文排版

Web表格信息抽取技术的研究

袁鸿雁  
【摘要】:互联网上有大量信息采用 HTML 表格表示,由于 HTML 不描述数据的内容,机器不能理解和查询。论文利用 HTML 表格属性,定位表格,提取出识别真假表格的特征信息,结合应用本体形成启发式规则,在此基础上对表格结构识别进行了分析,最后实现基于应用本体对表格数据进行抽取。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 袁鸿雁;;基于本体的HTML表格识别技术的研究[J];长春工程学院学报(自然科学版);2010年01期
2 张群会;表格数据自动识别技术研究[J];西安科技学院学报;2000年04期
3 李清泉,谢智颖,左小清,王冲;基于SVG的空间信息描述与可视化表达[J];测绘学报;2005年01期
4 葛宇;;分栏Word表格,全方位看齐![J];电脑爱好者;2008年11期
5 葛宇;;表格属性中的三种暗器[J];电脑知识与技术(经验技巧);2008年01期
6 刘真,吴泉源;非限定表格信息提取系统的研究[J];计算机学报;1995年11期
7 贺岩,崔喆;基于加权无向图的表格分割方法[J];计算机应用;2004年S1期
8 李朝;彭宏;叶苏南;张欢;杨亲遥;;基于DOM树的可适应性Web信息抽取[J];计算机科学;2009年07期
9 刘真,吴泉源;通用表格处理系统中定位方法的研究[J];软件学报;1996年07期
10 张晶;陈褔生;;知识管理中的基于XML的知识存储[J];计算机应用研究;2006年01期
11 曹步文;刘先锋;周忠华;;XML的DOM研究与应用[J];计算机时代;2008年02期
12 陈立娜;张红;马莉;蒋运承;;基于本体的旅游信息抽取[J];计算机应用与软件;2010年04期
13 钟琴 ,黄晓;用DOM树实现XML与高级语言的数据交互[J];微型机与应用;2003年09期
14 孙霞,程宏斌;基于Java的DOM解析技术[J];计算机时代;2004年07期
15 古丽娜孜;XML数据查询技术探讨[J];新疆大学学报(自然科学版);2005年03期
16 黄帆;;关于Native-XML数据库模型的探讨[J];技术与市场;2006年11期
17 赵燕娟;李廉;苏伟;李冠宇;;基于MathML的网络数学公式编辑器的实现[J];计算机工程;2008年07期
18 朱跃林;戴昌林;高志强;;基于SRI的动态网页信息抽取方法[J];重庆工学院学报(自然科学版);2009年10期
19 孙全红;张贞贞;;基于树结构的Web表格信息抽取方法[J];华北水利水电学院学报;2011年03期
20 熊光彩,莫 蓉,赵歆波,张定华;XML文档对象模型研究与应用[J];计算机工程与设计;2002年05期
中国重要会议论文全文数据库 前5条
1 袁鸿雁;;Web表格信息抽取技术的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
2 王英奎;潘无名;李孝文;谭钱茂;;一种基于DOM树的Web信息提取方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
3 赵姗;李宏伟;蓝士斌;;VC环境下利用DOM存取WebGIS中XML格式地图数据[A];中国地理信息系统协会第八届年会论文集[C];2004年
4 仲跻亮;甘仞初;;基于SOAP消息的数据库对LDAP目录的数据更新研究[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
5 陈刚;高翔;许继恒;;仿真数据库系统开发[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
中国硕士学位论文全文数据库 前10条
1 刘建华;基于关系数据库的XML存储查询系统设计[D];合肥工业大学;2004年
2 李知颖;基于包装器模型的信息抽取算法研究[D];东北师范大学;2009年
3 陈佳;基于XML的Web信息抽取技术的应用研究[D];武汉理工大学;2007年
4 史西兵;基于XML的Web信息抽取技术研究[D];西北大学;2008年
5 刘秋水;Web信息抽取与网页摘要的研究与应用[D];大连理工大学;2008年
6 邱亚娜;信息化教育领域的Web信息抽取技术研究[D];天津师范大学;2008年
7 王实;垂直搜索引擎中的网页对象抽取模型及实现技术研究[D];湖南大学;2009年
8 陈涛;基于网页关联特征的互联网图像自动标注系统[D];浙江大学;2007年
9 董之茵;网页信息提取与净化的研究[D];吉林大学;2008年
10 岳欢;XML文档在关系数据库中存储方案的研究[D];重庆大学;2003年
中国重要报纸全文数据库 前7条
1 赵江;Dreamweaver MX 2004从零开始(二)[N];中国电脑教育报;2003年
2 北京邮电大学 张剑;XML的显示——XSL样式单(上)[N];计算机世界;2001年
3 清华大学 李骅竞 邢春晓 张志强;NXDB与XEDB殊途同归[N];计算机世界;2003年
4 小羽;美化网页好帮手[N];中国电脑教育报;2002年
5 世纪鸟作坊 何勇平;网页图像效果[N];电脑报;2001年
6 ;汉王OCR金融行业解决方案[N];中国计算机报;2002年
7 上海 孟庆国;用Word套打凭证封面[N];电脑报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978