收藏本站
《第三届全国信息检索与内容安全学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于层式有限状态自动机的灾难事件抽取系统

钟涛  陈群秀  
【摘要】:本文首先介绍了信息抽取技术的现状和灾难性事件信息抽取方面目前取得的成果,并介绍了一种基于层式有限状态自动机的灾难性事件信息抽取系统,最后给出了系统的实验结果。在此系统中利用框架结构和三层的层式自动机,对灾难性事件进行信息抽取。通过实验,这个系统可以比较迅速准确地将输入的灾难事件文本中相关的灾难信息抽取出来,并且它的 F 度量值在85%左右。
【作者单位】:智能技术与系统国家重点实验室、清华信息科学与技术国家实验室(筹)清华大学计算机系 智能技术与系统国家重点实验室、清华信息科学与技术国家实验室(筹)清华大学计算机系
【基金】:本文承国家自然科学基金项目(项目号:60573185)资助
【分类号】:TP301.1;TP391.1
【正文快照】:
1.信息抽取技术的现状 信息抽取(Information Extraction:IE)是自然语言处理领域特别有用的一个子领域,其目标是把 第三局全国信息检索与内容安全学术会议 文本里包含的信息进行结构化处理,从文本中抽取出特定的事实信息(factual information)。输入 信息抽取系统的是原始

【参考文献】
中国期刊全文数据库 前2条
1 梁晗;陈群秀;吴平博;;基于事件框架的信息抽取系统[J];中文信息学报;2006年02期
2 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
中国博士学位论文全文数据库 前1条
1 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
2 李向阳,陆建江,张亚非;基于竞争分类的Web信息抽取[J];电子学报;2004年11期
3 李彦刚;魏海平;侯兴华;;基于HTMLParser的Web信息抽取系统的设计与实现[J];辽宁石油化工大学学报;2006年02期
4 李向阳;戴江山;张亚非;;一种Web信息抽取规则的优化方法[J];兰州理工大学学报;2006年01期
5 李永平,金莉;基于填充标记的自适应Web信息提取[J];华中科技大学学报(自然科学版);2003年11期
6 杜永萍;黄萱菁;吴立德;;模式学习在QA系统中的有效实现[J];计算机研究与发展;2006年03期
7 屠文珂,阎保定,杨海涛;基于影射·特征·知识的辨识复杂彩色目标的方法[J];计算机工程与应用;2005年25期
8 李跃进;赵晶;林鸿飞;;基于Internet的军事演习信息抽取系统[J];计算机工程与应用;2006年14期
9 梁红兵,杨铭魁,黄晓;基于反馈规则学习的医学文献主题自动标引方法[J];计算机工程;2003年11期
10 钟敏娟;郝谦;刘云中;;基于多模板隐马尔可夫模型的文本信息抽取算法[J];计算机工程;2006年02期
中国重要会议论文全文数据库 前10条
1 刘晓东;朱翊;柳棽;;基于突发事件的空间信息定位匹配方法研究[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年
2 LI Xiang-yang~1, ZHANG Ya-fei~1, LU Jian-jiang~(1,2), XU Bao-wen~2 1. Institute of Communications Engineering, People's Liberation Army University of Science and Techndogy. Nanjing 210007, Jiangsu, China; 2. Department of Computer Science and Engineering. Southeast University, Nanjing 210096, Jiangsu, China;A Classification Method for Web Information Extraction[A];Proceedings of the First Conference on Web Information System and Applications(WISA 2004)[C];2004年
3 刘秉权;王喻红;葛冬梅;李佳;;基于结构树解析的网页正文抽取方法[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
4 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
5 LI Xiang-yang , ZHANG Ya-fei , LU Jian-jiang, XU Bao-wen Institute of Communications Engineering, People's Liberation Army University of Science and Technology, Nanjing 210007, Jiangsu, China; Department of Computer Science and Engineering, Southeast University, Nanjing 210096, Jiangsu, China;A Classification Method for Web Information Extraction[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年
6 Suxiang Zhang,Juan Wen ,Ying Qin ,Xiaojie Wang ,Yixin Zhong School of Information Engineering, Beijing University of Posts and Telecommunications, Beijing, 100876, P. R. China Department of Electronic and Communication Engineering, North China Electric Power University, Baoding, 071003, P. R. China;The Research and Application about the Information Extraction in Chinese Domain[A];第八届国际信号处理国际会议论文集[C];2006年
7 汪建伟;高军;王腾蛟;杨冬青;;一种基于显示属性的网页信息提取方法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
8 周剑辉;苑春法;黄锦辉;李文捷;;金融领域内信息抽取规则的自动获取[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
9 叶娜;吴雪军;朱靖波;陈文亮;;基于相似计算的信息抽取模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 许建潮;Web挖掘中若干问题的研究[D];吉林大学;2005年
2 俞方桦;互联网信息资源整合研究[D];东华大学;2001年
3 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
4 郑桂华;基于网络的语文校本课程研究与实践[D];华东师范大学;2004年
5 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
6 邓绪斌;面向复杂数据源的数据抽取模型和算法研究[D];复旦大学;2005年
7 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
8 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
9 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
10 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
中国硕士学位论文全文数据库 前10条
1 汤赛丽;常识知识问答系统中知识库构建的研究与设计[D];河南大学;2005年
2 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
3 陈少飞;Web信息抽取规则的优化及规则的XQuery表达[D];河北大学;2003年
4 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
5 刘云中;基于隐马尔可夫模型的文本信息抽取算法研究[D];湖南大学;2004年
6 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
7 吕行;基于XML的异构数据源集成系统研究与应用[D];河海大学;2004年
8 庄明;装备发展战略研究信息化平台中汉语文本信息提取技术的研究[D];国防科学技术大学;2003年
9 董树明;半结构化Web信息抽取技术及其应用研究[D];东南大学;2004年
10 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 徐延勇,周献中,井祥鹤,郭忠伟;基于最大熵模型的汉语句子分析[J];电子学报;2003年11期
2 徐延勇,杨方,周献中,郭忠伟;C~4ISR中基于XML的作战文书标准化[J];火力与指挥控制;2003年06期
3 徐延勇,朱雪平,周献中,井祥鹤;C~4ISR中基于XML的标准化作战文书与数据库的映射[J];火力与指挥控制;2005年03期
4 孙宏纲,姚景顺,闫国玉;基于自然语言理解的军事自动标图系统[J];火力与指挥控制;2005年S1期
5 鲍广宇,杨飞,刘晓明;军事文本标图系统的设计与原型实现[J];解放军理工大学学报(自然科学版);2003年03期
6 李向阳,张亚非;基于语义标注的信息抽取[J];解放军理工大学学报(自然科学版);2004年04期
7 胡斌,汤伟,刘晓明;基于自然语言理解的文本标图系统设计与实现[J];解放军理工大学学报(自然科学版);2005年02期
8 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
9 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
10 张晓艳;王挺;陈火旺;;命名实体识别研究[J];计算机科学;2005年04期
中国重要会议论文全文数据库 前9条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
2 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
3 陈华;梁循;阮进;;网络与舆情关联分析系统的设计实现[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 曾依灵;许洪波;白硕;;改进的OPTICS算法及其在文本聚类中的应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 章成志;;基于机器学习的文本聚类描述算法研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 孙忠贵;陈杰;孙玉珍;张义宁;;一种基于小波和Hough变换的仿射不变性商标检索[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 高杨;王向东;钱跃良;刘群;;基于音频重复性的广告检测[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 高鹏;梁家恩;王晓瑞;徐波;;一个面向海量视音频应用的快速关键音检索系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前6条
1 干红华;基于事件的因果关系可计算化分析研究[D];浙江大学;2003年
2 郭忠伟;作战文书自动生成理论及方法研究[D];南京理工大学;2003年
3 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
4 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
5 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
6 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
中国硕士学位论文全文数据库 前5条
1 李娜;面向作战文书智能处理的电子词典的研究与实现[D];南京理工大学;2003年
2 温锐;中文命名实体识别及其关系抽取研究[D];苏州大学;2005年
3 廖先桃;中文命名实体识别方法研究[D];哈尔滨工业大学;2006年
4 李康;自然语言理解中的语义形式化研究[D];西北工业大学;2007年
5 冯礼;基于事件框架的突发事件信息抽取[D];上海交通大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报(自然科学版);1998年01期
2 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
3 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
4 袁毓林;信息抽取的语义知识资源研究[J];中文信息学报;2002年05期
5 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
6 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
7 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
8 崔桓,蔡东风,苗雪雷;基于网络的中文问答系统及信息抽取算法研究[J];中文信息学报;2004年03期
9 郝秀兰,杨尔弘;基于小规模语料库和机器可读词典的二元分布语义获取[J];中文信息学报;2004年06期
10 王厚峰;汉语篇章的指代消解浅论[J];语言文字应用;2004年04期
中国重要会议论文全文数据库 前2条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
2 陈群秀;;信息处理用现代汉语句型系统的初步研究[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国博士学位论文全文数据库 前1条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
中国硕士学位论文全文数据库 前2条
1 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
2 王昀;金融领域中汉语时间信息抽取的研究[D];清华大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 李向阳;苗壮;肖江;;无结构文本信息抽取综述[J];军事通信技术;2004年02期
2 贺令亚;柳佳刚;;基于Web的包装器技术的现状与发展[J];电脑开发与应用;2007年06期
3 张春明;;Web挖掘技术研究[J];廊坊师范学院学报(自然科学版);2008年05期
4 张岩;;基于本体的信息抽取技术研究[J];科技信息(学术研究);2008年36期
5 邹荣;;对垂直搜索技术的分析[J];福建电脑;2009年02期
6 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
7 于薇;;包装器的自动生成方法介绍[J];才智;2009年28期
8 张涛;胡正华;夏明星;;远洋运输业业务邮件信息抽取系统的设计及实现[J];电脑知识与技术;2010年01期
9 朱青;吕晓旭;;基于机器学习的HTML标题抽取[J];微计算机信息;2010年09期
10 祝伟华;卢熠;刘斌斌;;基于HMM的Web信息抽取算法的研究与应用[J];计算机科学;2010年02期
中国重要会议论文全文数据库 前10条
1 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
3 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
4 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 姜吉发;王树西;;一种自举的二元关系获取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
8 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 徐云风;蒋文蓉;;Web页面信息抽取的分析与研究[A];IT服务促进企业信息化——第十一届中国Java技术及应用交流大会文集[C];2008年
10 孟红;钟华;;基于htmlparser的搜索引擎信息抽取系统设计与实现[A];第六届全国信息检索学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 彭芳;搜索也专业[N];中国计算机报;2004年
3 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
4 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
5 司静辉;直击数字环境下情报技术发展动向[N];科技日报;2007年
6 董振东;到用户中去[N];中国计算机报;2003年
7 张友林 甘肃省武威市凉州区中医院;开发中医专用软件很有必要[N];中国中医药报;2009年
8 任一鸣;垂直搜索:抓住细分需求[N];计算机世界;2007年
9 马志彦;悄然而至的EIP[N];中国计算机报;2002年
10 本报记者 于翔;BI:电信业渗透中[N];网络世界;2004年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
4 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
5 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
6 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
7 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
8 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
9 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
10 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
3 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
4 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
5 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
6 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
7 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
8 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
9 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
10 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026