收藏本站
《第三届学生计算语言学研讨会论文集》2006年
加入收藏

中文事件抽取中事件类别的自动识别

赵妍妍  王啸吟  秦兵  车万翔  刘挺  
【摘要】:事件抽取是目前信息抽取研究领域的一个新的重要的研究课题。本文结合美国国家标准技术研究院(NIST)组织的自动内容抽取(ACE,Automatic Content Extraction)评测中的事件抽取任务的要求,在ACE2005的训练数据上进行事件抽取中事件类别识别的实验。实验中采用《同义词词林(扩展版)》扩展从训练语料中提取出的触发词,构建触发词表,并结合两种机器学习方法——最大熵(ME,Maximum Entropy)和支持向量机(SVM,Support Vector Machine),抽取合适的特征,使得事件类别识别的F-Score分别达到了69.2%和69.9%。
【作者单位】:哈尔滨工业大学计算机学院信息检索研究室 哈尔滨工业大学计算机学院信息检索研究室 哈尔滨工业大学计算机学院信息检索研究室 哈尔滨工业大学计算机学院信息检索研究室 哈尔滨工业大学计算机学院信息检索研究室
【关键词】:事件抽取 ACE评测 最大熵 支持向量机
【基金】:国家自然科学基金,资助号:60435020,60575042,60503072 腾讯基金项目
【分类号】:TP391.4
【正文快照】:
1引言 事件抽取是目前信息抽取研究领域的一个新的研究点。信息抽取的主要目的是将无结构的文本转化为结构化 或半结构化的信息,并以数据库的形式存储,供用户查询以及进一步分析利用。信息抽取系统的主要功能是从文 本中抽取出特定的事实信息,我们称之为实体(Entity),例如

【参考文献】
中国重要会议论文全文数据库 前1条
1 车万翔;刘挺;李生;;实体关系自动抽取[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
【共引文献】
中国期刊全文数据库 前1条
1 张素香;李蕾;谭咏梅;;特定领域下关系模板的研究[J];北京邮电大学学报;2006年05期
【同被引文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报(自然科学版);1998年01期
2 胡睿,张冬茉,杜蓬;基于结点语义关系的信息抽取技术[J];计算机工程;2001年04期
3 孔祥勇,张冬茉;一种信息抽取系统中汉语同指消解算法[J];计算机工程;2003年16期
4 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
5 袁毓林;信息抽取的语义知识资源研究[J];中文信息学报;2002年05期
6 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
7 袁毓林;用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J];中文信息学报;2005年05期
8 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[J];中文信息学报;2006年01期
9 杨尔弘;方莹;刘冬明;乔羽;;汉语自动分词和词性标注评测[J];中文信息学报;2006年01期
10 于琨;管刚;周明;王煦法;蔡庆生;;基于双层级联文本分类的简历信息抽取[J];中文信息学报;2006年01期
中国硕士学位论文全文数据库 前2条
1 徐超;基于种子自扩展的命名实体关系抽取方法的研究[D];华中师范大学;2006年
2 陈静;基于本体的信息抽取研究[D];苏州大学;2007年
【相似文献】
中国期刊全文数据库 前1条
1 董静;孙乐;冯元勇;黄瑞红;;中文实体关系抽取中的特征选择研究[J];中文信息学报;2007年04期
中国重要会议论文全文数据库 前2条
1 车万翔;刘挺;李生;;实体关系自动抽取[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026