收藏本站
《中国农业信息科技创新与学科发展大会论文汇编》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Web的农业信息自动抽取方法研究

王文生  谢能付  
【摘要】:面向 Web 的信息抽取是当前信息抽取研究领域的热点之一。本文从领域的角度出发,研究基于 Web 的农业信息自动抽取方法。该方法的主要思想是利用预先领域语料生成领域词汇集,自动计算网页内容的相似度,确定信息采集的页面区域,再根据网页内容半自动归纳学习抽取规则,自动抽取网页信息, 形成结构化的信息。实验证明,这种方法能够较好回避网页信息的不规范性和动态性,特别是在领域约束下,具有较高的抽取效率。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 李剑波;李小华;董树明;杨科华;;一种基于XML的Web信息抽取方法[J];情报杂志;2006年08期
中国硕士学位论文全文数据库 前1条
1 贺智平;Web信息自动抽取技术研究[D];西安电子科技大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 王茹,宋瀚涛,陆玉昌;基于树自动机的网页数据抽取[J];北京理工大学学报;2004年09期
2 李向阳,陆建江,张亚非;基于竞争分类的Web信息抽取[J];电子学报;2004年11期
3 李向阳;戴江山;张亚非;;一种Web信息抽取规则的优化方法[J];兰州理工大学学报;2006年01期
4 潘晔;任广伟;舒艳;;利用本体进行Web数据集成[J];贵州工业大学学报(自然科学版);2006年03期
5 李石君;于俊清;欧伟杰;;基于HTML模式代数的Web信息提取方法[J];计算机研究与发展;2006年09期
6 王茹,宋瀚涛,陆玉昌;网页数据自动抽取系统[J];计算机工程与应用;2004年19期
7 许建潮,侯锟;Web信息的自主抽取方法[J];计算机工程与应用;2005年14期
8 王亮,朱征宇;基于扩展标记图的Web信息抽取器[J];计算机工程;2005年08期
9 朱永盛;武港山;;基于Web的新闻信息抽取[J];计算机工程;2006年10期
10 厉小润;基于XML的可分发Web客户端的研究与实现[J];计算机应用;2003年06期
中国重要会议论文全文数据库 前1条
1 翟伟斌;许榕生;;基于Internet的CIS研究[A];第十三届全国核电子学与核探测技术学术年会论文集(下册)[C];2006年
中国博士学位论文全文数据库 前6条
1 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
2 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
3 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
4 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
5 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年
6 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 陈佳;基于XML的Web信息抽取技术的应用研究[D];武汉理工大学;2007年
2 陈皓;电力设备状态检修辅助分析系统的研究与实现[D];西安理工大学;2005年
3 朱延东;信息网格环境下信息资源的异构集成与透明访问研究[D];河海大学;2005年
4 吕岷;基于XML的产品信息发布系统[D];武汉科技大学;2002年
5 蒋蔚;面向信息化制造的设备状态信息监视系统开发[D];南京航空航天大学;2003年
6 杨友河;基于XML的ERP环境下的人力资源管理系统研究[D];昆明理工大学;2004年
7 赵珺;基于Web的无机材料网络课件开发平台的研究与应用[D];中南大学;2004年
8 刘云中;基于隐马尔可夫模型的文本信息抽取算法研究[D];湖南大学;2004年
9 张谦;基于Web的数据仓库系统在生产计划管理中的应用研究[D];重庆大学;2004年
10 许发见;元数据在教学网站中的应用研究[D];河海大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 李蕾;周延泉;王菁华;;基于全信息的中文信息抽取系统及应用[J];北京邮电大学学报;2005年06期
2 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
3 李彦刚;魏海平;侯兴华;;基于HTMLParser的Web信息抽取系统的设计与实现[J];辽宁石油化工大学学报;2006年02期
4 李向阳;戴江山;张亚非;;一种Web信息抽取规则的优化方法[J];兰州理工大学学报;2006年01期
5 张绍华,徐林昊,杨文柱,薛文玲,李天柱;基于样本实例的Web信息抽取[J];河北大学学报(自然科学版);2001年04期
6 游红俊,郭庆平,张文萍,袁春明;网络环境下信息系统集成技术研究[J];计算机工程与应用;2002年19期
7 张聚礼,余冬梅,张秋余;基于C/S的软件体系结构研究[J];计算机工程与应用;2003年08期
8 周明建,高济,李飞;基于本体论的Web信息抽取[J];计算机辅助设计与图形学学报;2004年04期
9 伊明,王文杰;有关智能Web服务问题的讨论[J];计算机仿真;2003年05期
10 孙承杰,关毅;基于统计的网页正文信息抽取方法的研究[J];中文信息学报;2004年05期
中国重要会议论文全文数据库 前1条
1 陈静;朱巧明;贡正仙;李培锋;;特定本体指导的信息抽取技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
【二级参考文献】
中国期刊全文数据库 前2条
1 李鹤龄;信息熵、玻尔兹曼熵以及克劳修斯熵之间的关系——兼论玻尔兹曼熵和克劳修斯熵是否等价[J];大学物理;2004年12期
2 张绍华,薛文玲,李天柱;基于Web的快速信息抽取[J];计算机应用;2001年07期
【相似文献】
中国期刊全文数据库 前10条
1 李向阳;苗壮;肖江;;无结构文本信息抽取综述[J];军事通信技术;2004年02期
2 贺令亚;柳佳刚;;基于Web的包装器技术的现状与发展[J];电脑开发与应用;2007年06期
3 张春明;;Web挖掘技术研究[J];廊坊师范学院学报(自然科学版);2008年05期
4 张岩;;基于本体的信息抽取技术研究[J];科技信息(学术研究);2008年36期
5 邹荣;;对垂直搜索技术的分析[J];福建电脑;2009年02期
6 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
7 于薇;;包装器的自动生成方法介绍[J];才智;2009年28期
8 张涛;胡正华;夏明星;;远洋运输业业务邮件信息抽取系统的设计及实现[J];电脑知识与技术;2010年01期
9 朱青;吕晓旭;;基于机器学习的HTML标题抽取[J];微计算机信息;2010年09期
10 祝伟华;卢熠;刘斌斌;;基于HMM的Web信息抽取算法的研究与应用[J];计算机科学;2010年02期
中国重要会议论文全文数据库 前10条
1 王文生;谢能付;;基于Web的农业信息自动抽取方法研究[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
2 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
3 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
4 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 姜吉发;王树西;;一种自举的二元关系获取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
8 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 徐云风;蒋文蓉;;Web页面信息抽取的分析与研究[A];IT服务促进企业信息化——第十一届中国Java技术及应用交流大会文集[C];2008年
10 孟红;钟华;;基于htmlparser的搜索引擎信息抽取系统设计与实现[A];第六届全国信息检索学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 彭芳;搜索也专业[N];中国计算机报;2004年
3 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
4 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
5 司静辉;直击数字环境下情报技术发展动向[N];科技日报;2007年
6 董振东;到用户中去[N];中国计算机报;2003年
7 张友林 甘肃省武威市凉州区中医院;开发中医专用软件很有必要[N];中国中医药报;2009年
8 任一鸣;垂直搜索:抓住细分需求[N];计算机世界;2007年
9 马志彦;悄然而至的EIP[N];中国计算机报;2002年
10 本报记者 于翔;BI:电信业渗透中[N];网络世界;2004年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
4 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
5 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
6 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
7 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
8 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
9 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
10 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
3 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
4 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
5 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
6 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
7 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
8 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
9 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
10 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026