收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于XPath的Web信息抽取

徐林昊  杨文柱  陈少飞  郝亚南  李天柱  
【摘要】:正1引言以HTML发布的Web信息面向显示,缺乏模式信息和语义信息,为了更有效地管理和组织Web信息,实现对Web信息高效的查询与检索,XML及其相关规范随之诞生了。XML将Web信息的语义与显示分离开来,通过自定义带有语义信息的标记,提供给应用程序所需的语义信息。但是,Web上大量存在的仍旧是HTML信息,为了以结构化和一致的方式访问HTML信息以及方便计算机对Web信息的自动处理,人们采用了信息抽取技术。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王锟;;WEB文档信息抽取方法研究[J];福建电脑;2008年03期
2 王钢明;屠建飞;;基于Web信息抽取的技术成果信息采集系统[J];成组技术与生产现代化;2007年04期
3 何章鸿;董守斌;;基于XPath的广告数据提取研究[J];江西师范大学学报(自然科学版);2008年02期
4 支宗良;陈少飞;;一种基于XQuery的优化Web信息抽取方法[J];计算机应用;2008年01期
5 刘云峰;;一种基于标签路径聚类的文本信息抽取算法[J];计算机应用与软件;2010年11期
6 李姗;黄水源;;基于XML的WEB信息抽取模型设计[J];微计算机信息;2009年09期
7 熊惠荟;欧阳君;;基于模板法的网页英语试卷自动抽取技术的研究[J];计算机与数字工程;2009年04期
8 王楠;;一种实现Web数据到XML文档的转换算法[J];大连海事大学学报;2010年03期
9 陈俊彬;;Web信息抽取策略及其实现方法研究[J];科技情报开发与经济;2008年23期
10 杨鲲,孟波;一种基于XML的Web数据挖掘方法[J];计算机应用;2003年S1期
11 张彦超;刘云;李勇;沈波;;基于自动生成模板的Web信息抽取技术[J];北京交通大学学报;2009年05期
12 谭锋;崔亮亮;;基于XPath的XML数据提取的C#实现[J];电脑知识与技术;2011年09期
13 陈奇;XSLT、XPath和DOM的应用研究[J];计算机工程;2003年03期
14 周登;戴玉刚;付涛;;基于树结构的Web信息抽取[J];计算机技术与发展;2009年09期
15 朱雪莲;;基于Lucene专业搜索引擎的研究应用[J];现代计算机(专业版);2010年09期
16 王红霞,姚家亮;利用ASP构建新型信息系统的方法与实现[J];计算机应用;1999年09期
17 王清心,胡建华;经贸数据库的WEB集成发布[J];昆明理工大学学报;1999年02期
18 刘波,代亚非,杜跃进;远程协同教学系统中课程搜索子系统设计[J];计算机应用;2000年06期
19 梁开健,刘新民;基于ASP的图书馆Web数据库开发[J];高校图书馆工作;2000年04期
20 张睿光,黄玉超;基于ASP技术的气象信息系统软件设计[J];河南气象;2000年01期
中国重要会议论文全文数据库 前10条
1 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
4 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年
6 杨沁;张维勇;韩江洪;;KJ15A系统基于Web的动态浏览设计研究[A];2004“安徽制造业发展”博士科技论坛论文集[C];2004年
7 谢丽聪;白清源;;基于Web的网上继续教育系统[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
8 于冰;于守健;丁祥武;乐嘉锦;;基于多层次接口匹配的语义Web服务自动组合研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
9 谢彦麒;谢丽聪;白清源;谢伙生;张莹;;挖掘Web访问模式的一种基于路径克隆的新算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 刘振鹏;常晓萌;张杨;宋晓静;周冬冬;;基于QoS的语义Web服务选择[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
2 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
3 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
4 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
5 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
6 张卓;基于形式概念分析的Web数据库抽取研究[D];武汉大学;2011年
7 孔鸿滨;语义Web技术的本体安全性研究[D];云南大学;2012年
8 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
9 聂铁铮;Deep Web中Web数据库集成关键技术的研究[D];东北大学;2009年
10 张顺香;Web环境下关联语义链接特征分析及其应用研究[D];上海大学;2012年
中国硕士学位论文全文数据库 前10条
1 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
2 田宇;基于XML的WEB信息抽取系统研究与实现[D];内蒙古大学;2011年
3 杨红超;基于HMM和BP网络混合模型的web文本信息抽取研究[D];南华大学;2011年
4 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年
5 周盛强;半结构化Web信息抽取研究[D];哈尔滨工程大学;2009年
6 李向春;基于规则的Web文本信息抽取技术的研究[D];电子科技大学;2011年
7 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
8 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
9 胡航丽;基于Web的股评观点倾向性分析研究[D];北京工商大学;2010年
10 胡峰;Web数据挖掘及其在网络新闻文本数据中的应用[D];电子科技大学;2010年
中国重要报纸全文数据库 前10条
1 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
2 闫冰;“推”出Web交付新天地[N];网络世界;2009年
3 ;Web2.0工具使用须谨慎[N];网络世界;2009年
4 本报记者 那罡 北京启明星辰信息技术股份有限公司首席执行官 严望佳 东软网络安全产品营销中心副总经理 李青山 绿盟科技总裁 沈继业 联想网御产品研发中心总经理 谭曙光;2008·信息安全Web风险唱主角[N];中国计算机报;2008年
5 编译 郭涛;Web 2.0存储:低成本还要易扩展[N];中国计算机报;2010年
6 本报记者 于翔;企业级协作拥抱Web 2.0[N];网络世界;2010年
7 张鹃;以Web 2.0技术搭建企业知识管理平台[N];中国计算机报;2008年
8 ;揭开Web信誉的秘密[N];中国计算机报;2009年
9 本报记者 徐恒;手机浏览器:竞争不断加剧 Web大势所趋[N];中国电子报;2009年
10 本报记者 汤浔芳;企业级Web 2.0很难突破10%[N];计算机世界;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978