收藏本站
《全国第八届计算语言学联合学术会议(JSCL-2005)论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于时空分析的线索性事件的抽取与集成系统研究

吴平博  陈群秀  马亮  
【摘要】:信息抽取技术能够提供高质量的检索服务。本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成。系统中采用了如下的方法、策略:(1)利用句型模板构造抽取规则,然后直接从经过时间短语和空间短语识别和规范化处理的文本中抽取事件信息,从而跳过了深层句法分析,降低了实现系统的难度;(2)利用事件的规范化的时空信息关联不同文档中的同一事件,进行事件合并;(3)文档发生事件转移时对文档进行事件切分,从而解决了文档内不同事件信息的归并问题。初步实验结果表明:本文采用的方法和策略是有效的,抽取结果达到了国内外事件抽取的先进水平,而线索性事件集成的研究则是一种创新尝试.

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
2 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
3 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
【共引文献】
中国期刊全文数据库 前10条
1 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
2 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
3 赵江江;秦兵;;基于BootStrapping的中文事件元素抽取系统设计与实现[J];智能计算机与应用;2012年01期
4 霍娜;吕国英;;基于规则匹配的灾难性追踪事件信息抽取的研究[J];电脑开发与应用;2012年06期
5 方莹,葛寒松;基于聚类的分级信息抽取方法初探[J];电脑知识与技术;2005年30期
6 赵文;唐建雄;高庆锋;;基于统计的中文网页正文抽取的研究[J];电脑知识与技术;2008年01期
7 余承健;;基于表格语义的Web信息抽取方法的研究[J];电脑知识与技术;2008年12期
8 胡静芳;沈亚斌;;基于Web的新闻采集系统[J];电脑知识与技术;2009年19期
9 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
10 孙娜;;基于本体的文本分类研究综述[J];电脑知识与技术;2011年10期
中国重要会议论文全文数据库 前9条
1 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
2 赵敬华;高慧颖;魏军;;基于本体的商品信息查询系统与算法研究[A];中国企业运筹学[C];2009年
3 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
4 张桂平;蔡东风;徐立军;尹宝生;陈建军;;以互联网为知识源的基于语段分析的交互式机器翻译技术的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 庄成龙;钱龙华;周国栋;;基于树核函数的实体关系抽取方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
7 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 程晓;郑德权;杨宇航;邵国军;;面向半结构化文本的领域本体关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 付瑞吉;秦兵;刘挺;;面向音乐领域的文本检索与挖掘系统[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
2 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
3 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
4 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
5 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
6 单建芳;面向事件的文本表示研究[D];上海大学;2012年
7 张蕾;概念结构及其应用[D];西北工业大学;2001年
8 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
9 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
10 许建潮;Web挖掘中若干问题的研究[D];吉林大学;2005年
【同被引文献】
中国期刊全文数据库 前1条
1 姚家奕,姜海,王秦;决策树算法的系统实现与修剪优化[J];计算机工程与设计;2002年08期
【二级引证文献】
中国期刊全文数据库 前4条
1 王曙;吉雷静;张雪英;赵仁亮;陈晓丹;余浩;;面向网页文本的地理要素变化检测[J];地球信息科学学报;2013年05期
2 逯万辉;马建霞;赵迎光;;爆发词识别与主题探测技术研究综述[J];情报理论与实践;2012年06期
3 李俊;;语义数据库Freebase研究[J];现代图书情报技术;2011年10期
4 逯万辉;马建霞;;基于条件随机场模型的复杂时间信息抽取研究[J];现代图书情报技术;2011年10期
中国重要会议论文全文数据库 前1条
1 王鹏;张永奎;;基于新闻网页主题要素的网页去重方法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
【相似文献】
中国期刊全文数据库 前10条
1 陆科进,李新颖;基于Ontology的文本信息抽取[J];计算机应用研究;2003年07期
2 李向阳;苗壮;肖江;;无结构文本信息抽取综述[J];军事通信技术;2004年02期
3 贺令亚;柳佳刚;;基于Web的包装器技术的现状与发展[J];电脑开发与应用;2007年06期
4 张岩;;基于本体的信息抽取技术研究[J];科技信息(学术研究);2008年36期
5 邹荣;;对垂直搜索技术的分析[J];福建电脑;2009年02期
6 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
7 张涛;胡正华;夏明星;;远洋运输业业务邮件信息抽取系统的设计及实现[J];电脑知识与技术;2010年01期
8 胡致涌;胡迎松;;基于领域本体的信息抽取系统的设计与实现[J];价值工程;2010年14期
9 丁君军;郑彦宁;化柏林;;国内外属性抽取研究综述[J];情报科学;2011年05期
10 周纯;;垂直搜索引擎技术进展[J];知识经济;2011年09期
中国重要会议论文全文数据库 前10条
1 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 姜吉发;王树西;;一种自举的二元关系获取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
5 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
6 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 李德仁;;地球空间信息学的机遇[A];中国地理信息系统协会第八届年会论文集[C];2004年
8 付雷;吕雅娟;刘群;;基于句型模板和统计机器翻译技术的翻译方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 孟红;钟华;;基于htmlparser的搜索引擎信息抽取系统设计与实现[A];第六届全国信息检索学术会议论文集[C];2010年
10 戴玉刚;;藏文网页采集技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国重要报纸全文数据库 前3条
1 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
2 陈琼 通讯员 李晶;我国气象地理信息系统基础版问世[N];中国气象报;2007年
3 希安;微软试水信息检索[N];经济日报;2004年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
4 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
5 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
6 张兵;时空信息辅助下的高光谱数据挖掘[D];中国科学院研究生院(遥感应用研究所);2002年
7 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
8 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
9 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
10 李欢;问答系统中的文本信息抽取研究与应用[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
3 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
4 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
5 田宇;基于XML的WEB信息抽取系统研究与实现[D];内蒙古大学;2011年
6 杨选选;基于概念图和语义角色的多领域信息抽取系统研究[D];西北大学;2010年
7 刘艺琴;基于本体的Web非规范知识处理中信息抽取技术研究[D];昆明理工大学;2005年
8 雷佩莹;基于Web的新闻信息抽取系统设计与实现[D];西北大学;2008年
9 陈亮华;基于网络爬虫的基金信息抽取与分析平台[D];华南理工大学;2010年
10 杨红超;基于HMM和BP网络混合模型的web文本信息抽取研究[D];南华大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026