收藏本站
《全国网络与信息安全技术研讨会论文集(上册)》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于显示属性的网页信息提取方法

汪建伟  高军  王腾蛟  杨冬青  
【摘要】:在目前的 Web 信息提取技术中,很多都是基于 HTML 结构的,由于 HTML 结构的经常变化, 使提取模板需要经常更新,而提取模板的更新需要很多领域知识。本文提出一种基于显示属性的 Web 信息提取方法,通过将网页文本按照其显示属性的不同进行分组,以显示属性值为基础对 Web 页面文本进行分类,获取所关注文本,从而完成对 Web 页面的信息提取。这种提取方法操作简单、易于实现,不依赖源网页的结构。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙荣胜,李志华,施明辉,徐天鹏;XML与汽车零部件信息采集系统的研究与实现[J];计算机应用;2002年02期
2 韩桂英,李锡祚;基于XML的网络课件标准化问题的研究与设计[J];微电子学与计算机;2002年11期
3 杨厚群;XML在ASP服务端的应用研究[J];计算机系统应用;2002年02期
4 卢方国,李卫华;使用SAX2分析XML文档[J];计算机与现代化;2003年09期
5 白连军,蒋式勤;XML在构建企业信息系统中的应用[J];微型电脑应用;2003年10期
6 孙霞,程宏斌;基于Java的DOM解析技术[J];计算机时代;2004年07期
7 杨敬伟;杨文柱;高悦;;基于DOM的Web信息抽取规则的构造与实现[J];河北大学学报(自然科学版);2007年02期
8 何成万,闵华清;一个基于Java和XML的Web应用软件开发模型研究[J];计算机应用;2001年S1期
9 李勇军,冀汶莉,马光思;用DOM解析XML文档[J];计算机应用;2001年S1期
10 陈庆章,胡同森;以XML文件为例实现在CORBA结构下对异质性数据的访问[J];计算机工程;2002年01期
11 熊光彩,莫 蓉,赵歆波,张定华;XML文档对象模型研究与应用[J];计算机工程与设计;2002年05期
12 陆楠,周春光;WEB数据挖掘中异构数据集成问题的研究[J];深圳大学学报(理工版);2002年03期
13 于野,刘士明,王闯,徐辉;省级政务信息化地理信息支撑平台的建设与信息共享[J];测绘通报;2003年06期
14 逯鹏,吴壮志,陈峰,吕良双;可视化智能化XML编辑器CPWORD的设计与实现[J];计算机工程;2003年12期
15 屈志杰,郑衍衡,韩冬;XML自动阅卷系统的设计与实现[J];计算机工程;2003年16期
16 牛艳芳;利用XML技术生成的Web Tree Folder[J];计算机时代;2003年04期
17 叶晓彤;基于XML部分加密的局部安全通信的实现[J];四川师范大学学报(自然科学版);2003年04期
18 季卫卫,张美凤,张之磊;XML技术在ERP中的应用[J];微型电脑应用;2003年05期
19 王芳,李正凡;用SAX解析XML文档的实现方法[J];华东交通大学学报;2004年01期
20 彭文滔;叶飞跃;李霞;员红娟;;信息抽取中基于DOM树的过滤器方法的研究[J];微计算机信息;2008年30期
中国重要会议论文全文数据库 前10条
1 汪建伟;高军;王腾蛟;杨冬青;;一种基于显示属性的网页信息提取方法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
2 Aymara Fernandez;;Complexation of Arsenite with Humic Acid in the Presence of Ferric Iron[A];第六届全国环境化学大会暨环境科学仪器与分析仪器展览会摘要集[C];2011年
3 周巍;孙冰;战立明;吕建华;王国仁;于戈;;基于DOM模型的XML查询处理器的设计与实现[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 封盛;张铭;;基于DOM树的半指导科技文献元数据自动抽取[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
5 王彦敏;卢刚;;基于PixelGrid实现DOM的快速更新[A];地理信息与物联网论坛暨江苏省测绘学会2010年学术年会论文集[C];2010年
6 周亚男;张思玉;陈景文;;DOM敏化抗抑郁药安非它酮间接光解机制研究[A];第六届全国环境化学大会暨环境科学仪器与分析仪器展览会摘要集[C];2011年
7 黄国城;孟凡刚;周忠波;李建;黄励晖;;河水DOM的生物转化机制研究[A];第六届全国环境化学大会暨环境科学仪器与分析仪器展览会摘要集[C];2011年
8 王琦;唐世渭;杨冬青;王腾蛟;;基于DOM的网页主题信息自动提取[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 刘叶;蔡美芳;乔显亮;;畜禽粪便来源DOM对土壤吸附土霉素的影响[A];第六届全国环境化学大会暨环境科学仪器与分析仪器展览会摘要集[C];2011年
10 陈健;卢刚;;数字正射影像图的投影变换[A];江苏省测绘学会2007'学术年会论文集[C];2008年
中国重要报纸全文数据库 前10条
1 记者 向杰;微软最新IE Dom Oday漏洞曝光[N];科技日报;2010年
2 中国贸促会;多米尼加汽车零备件销售分析[N];中国民族报;2001年
3 顾晓红;“喜欢那种透明”[N];联合时报;2000年
4 本报记者 唐斌;在管理软件市场中淘金[N];计算机世界;2001年
5 李语实;桑塔纳 价格重组促销灵活[N];中国物资报;2000年
6 孙静;证券业竞争 技术先行[N];中国电脑教育报;2001年
7 本报记者 董明洁;Dom Perignon[N];21世纪经济报道;2010年
8 北京天则经济研究所理事长 茅于轼教授;机构投资者急需建立信用[N];中国证券报;2002年
9 侯青;XML/EDI业务流程国际贸易B2B现状[N];国际商报;2001年
10 ;柬埔寨开发战争旅游[N];中国旅游报;2002年
中国博士学位论文全文数据库 前10条
1 张玉涛;光照和DOM对水体中汞转化的影响机制及动力学研究[D];西南大学;2011年
2 周斌;河水漫溢对荒漠河岸林植被及土壤的影响[D];新疆大学;2011年
3 王壮;四种人工纳米颗粒物在水相中的转化行为及生态毒理效应[D];大连理工大学;2013年
4 李光荣;面向虚拟企业的零件工艺信息系统关键技术研究[D];南京理工大学;2005年
5 吴文伶;离子型化合物对菲吸附解吸影响研究[D];南开大学;2010年
6 魏亮亮;改良土壤含水层处理系统对溶解性有机物的去除效能[D];哈尔滨工业大学;2011年
7 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
8 赵萱;我国不同生态型湖泊沉积物有机质赋存形态及其与重金属相互作用研究[D];山东师范大学;2012年
9 李悦铭;冻融作用对重金属污染土壤中黑麦草发芽和幼苗生长特征的影响研究[D];吉林大学;2013年
10 李巍;半结构化数据挖掘若干问题研究[D];吉林大学;2013年
中国硕士学位论文全文数据库 前10条
1 连小刚;基于DOM的Web信息抽取系统设计与实现[D];华中科技大学;2009年
2 张文;一种新型原生XML数据库——MyNXD的设计与实现[D];华东师范大学;2006年
3 李娟娟;用三维荧光技术研究DOM在人工湿地中的降解及其与染料的结合作用[D];西南大学;2011年
4 岳珂;基于自动机的嵌入式HTML解析器的设计与实现[D];重庆大学;2008年
5 王鑫;基于线特征的DOM与DLG配准方法的研究[D];武汉大学;2005年
6 赵静;基于XML和多层结构理论的营养咨询系统的设计与实现[D];山东大学;2005年
7 姚跃;中职信息技术技能考核系统设计与实现[D];湖南师范大学;2007年
8 石倩;Web信息抽取规则及其学习算法[D];大连海事大学;2008年
9 曲杰涛;基于DOM的智能网页信息抽取技术研究[D];中国海洋大学;2009年
10 孟瑜;基于Schema验证的XML解析器中解析子系统的设计与实现[D];西安电子科技大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978