收藏本站
《第三届学生计算语言学研讨会论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

中文事件抽取中事件类别的自动识别

赵妍妍  王啸吟  秦兵  车万翔  刘挺  
【摘要】:事件抽取是目前信息抽取研究领域的一个新的重要的研究课题。本文结合美国国家标准技术研究院(NIST)组织的自动内容抽取(ACE,Automatic Content Extraction)评测中的事件抽取任务的要求,在ACE2005的训练数据上进行事件抽取中事件类别识别的实验。实验中采用《同义词词林(扩展版)》扩展从训练语料中提取出的触发词,构建触发词表,并结合两种机器学习方法——最大熵(ME,Maximum Entropy)和支持向量机(SVM,Support Vector Machine),抽取合适的特征,使得事件类别识别的F-Score分别达到了69.2%和69.9%。
【作者单位】:哈尔滨工业大学计算机学院信息检索研究室 哈尔滨工业大学计算机学院信息检索研究室 哈尔滨工业大学计算机学院信息检索研究室 哈尔滨工业大学计算机学院信息检索研究室 哈尔滨工业大学计算机学院信息检索研究室
【关键词】:事件抽取 ACE评测 最大熵 支持向量机
【基金】:国家自然科学基金,资助号:60435020,60575042,60503072 腾讯基金项目
【分类号】:TP391.4
【正文快照】:
1引言 事件抽取是目前信息抽取研究领域的一个新的研究点。信息抽取的主要目的是将无结构的文本转化为结构化 或半结构化的信息,并以数据库的形式存储,供用户查询以及进一步分析利用。信息抽取系统的主要功能是从文 本中抽取出特定的事实信息,我们称之为实体(Entity),例如

【引证文献】
中国期刊全文数据库 前2条
1 于江德;李学钰;樊孝忠;庞文博;;最大熵模型的事件分类[J];电子科技大学学报;2010年04期
2 赵小明;朱洪波;陈黎;王亚强;秦湘清;于中华;;基于多分类器的金融领域多元关系信息抽取算法[J];计算机工程与设计;2011年07期
中国博士学位论文全文数据库 前2条
1 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
2 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
中国硕士学位论文全文数据库 前2条
1 陈慧炜;刑事案件文本信息抽取研究[D];南京师范大学;2011年
2 刘斌斌;基于HMM模型的Web信息抽取方法的研究与改进[D];重庆大学;2008年
【参考文献】
中国重要会议论文全文数据库 前1条
1 车万翔;刘挺;李生;;实体关系自动抽取[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
【共引文献】
中国期刊全文数据库 前1条
1 张素香;李蕾;谭咏梅;;特定领域下关系模板的研究[J];北京邮电大学学报;2006年05期
【同被引文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
2 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
3 贺前华,陆以勤,韦岗;一种新的HMM训练方法[J];电子学报;2000年09期
4 冯元勇;孙乐;张大鲲;李文波;;基于小规模尾字特征的中文命名实体识别研究[J];电子学报;2008年09期
5 蔡猷花,张岐山;数据挖掘技术及其应用[J];管理科学文摘;2003年02期
6 邓擘;郑彦宁;樊孝忠;;汉语信息抽取中事件的定位与分类[J];情报理论与实践;2009年10期
7 林静;曹德芳;苑春法;;中文时间信息的TIMEX2自动标注[J];清华大学学报(自然科学版);2008年01期
8 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
9 刘挺;车万翔;李生;;基于最大熵分类器的语义角色标注[J];软件学报;2007年03期
10 邓超;郭茂祖;;基于Tri-Training和数据剪辑的半监督聚类算法[J];软件学报;2008年03期
中国重要会议论文全文数据库 前2条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
2 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前5条
1 干红华;基于事件的因果关系可计算化分析研究[D];浙江大学;2003年
2 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
3 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
5 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
2 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
3 叶娜;面向信息抽取的文本预处理和规则自动学习技术研究[D];东北大学;2005年
4 吴雪军;面向信息抽取的命名实体识别与模板获取技术研究[D];东北大学;2005年
5 徐超;基于种子自扩展的命名实体关系抽取方法的研究[D];华中师范大学;2006年
6 廖先桃;中文命名实体识别方法研究[D];哈尔滨工业大学;2006年
7 陈静;基于本体的信息抽取研究[D];苏州大学;2007年
8 冯礼;基于事件框架的突发事件信息抽取[D];上海交通大学;2008年
9 徐亚娟;基于公安业务信息的文本挖掘技术研究与实现[D];浙江大学;2008年
10 陈川波;基于半结构化文本信息抽取的简历识别系统[D];北京邮电大学;2008年
【二级引证文献】
中国期刊全文数据库 前4条
1 赵江江;秦兵;;基于BootStrapping的中文事件元素抽取系统设计与实现[J];智能计算机与应用;2012年01期
2 马彬;洪宇;杨雪蓉;姚建民;朱巧明;;基于语义依存线索的事件关系识别方法研究[J];北京大学学报(自然科学版);2013年01期
3 侯立斌;李培峰;朱巧明;;基于CRFs和跨事件的事件识别研究[J];计算机工程;2012年24期
4 孔胜;王宇;;一种基于正文特征的新闻网页抽取方法[J];情报杂志;2010年08期
中国博士学位论文全文数据库 前2条
1 单建芳;面向事件的文本表示研究[D];上海大学;2012年
2 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
中国硕士学位论文全文数据库 前9条
1 李巍;企业信息搜索引擎的设计与关键技术的研究[D];内蒙古农业大学;2011年
2 杨红超;基于HMM和BP网络混合模型的web文本信息抽取研究[D];南华大学;2011年
3 吴靓;基于自然语言理解的3D场景构造研究[D];汕头大学;2011年
4 陈慧炜;刑事案件文本信息抽取研究[D];南京师范大学;2011年
5 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
6 董萍;基于知网语义关系的中文事件信息抽取研究[D];西安电子科技大学;2010年
7 李庆玲;弱指导中文实体关系抽取方法研究[D];华东师范大学;2012年
8 侯立斌;中文事件抽取与缺失角色填充的研究[D];苏州大学;2012年
9 孙琼;基于BP神经网络与隐马尔科夫链的驾驶状态识别[D];合肥工业大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 安国平;姜长生;吴庆宪;;基于PCNN和SVM的图像识别方法研究[J];电光与控制;2008年10期
2 马永军,方凯,刘暾东,方廷健;基于支持向量机和方差的管道内表面粗糙度等级识别[J];信息与控制;2002年05期
3 周志明,陈敏;支持向量机的人脸识别方法[J];咸宁学院学报;2003年03期
4 吴成东,杜崇峰,杨丽英;基于误差修正码的支持向量机大类别分类方法[J];沈阳建筑工程学院学报(自然科学版);2004年01期
5 张辉,张浩,陆剑峰;SVM在数据挖掘中的应用[J];计算机工程;2004年06期
6 李忠伟,张健沛,杨静,张福顺;基于支持向量机的虚拟企业伙伴选择方法研究[J];计算机应用研究;2004年12期
7 唐发明,王仲东,陈绵云;一种新的二叉树多类支持向量机算法[J];计算机工程与应用;2005年07期
8 王顺利;基于支持向量机(SVM)的图像去噪方法[J];微电子学与计算机;2005年04期
9 杨凌,刘玉树;基于支持向量机的坦克识别算法[J];影像技术;2005年02期
10 唐述敏,方景龙;基于支持向量机的人脸识别[J];计算机与数字工程;2005年07期
中国重要会议论文全文数据库 前10条
1 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
2 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
3 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
4 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
5 宋普云;沈雪勤;吴清;;一种改进的SMO算法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
6 乔立岩;彭喜元;彭宇;;基于支持向量机的键盘密码输入异常检测方法研究[A];2004全国测控、计量与仪器仪表学术年会论文集(上册)[C];2004年
7 王晶;薛毅;;基于有效集法的改进支持向量机算法[A];2007中国控制与决策学术年会论文集[C];2007年
8 王伟强;付立波;高文;黄庆明;蒋树强;;一种基于笔画特征的叠加文字检测方法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
9 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
10 徐扬;陈实;田玉敏;;基于核主成分分析的步态识别[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
中国重要报纸全文数据库 前3条
1 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
2 ;选择合适的数据挖掘算法[N];计算机世界;2007年
3 ;我的资源管理器[N];电脑报;2003年
中国博士学位论文全文数据库 前10条
1 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
2 佟伟民;股指期货交易中操纵行为识别方法研究[D];哈尔滨工业大学;2008年
3 陈万海;基于支持向量机的超谱图像分类技术研究[D];哈尔滨工程大学;2008年
4 田江;基于支持向量机的孤立点检测方法研究[D];大连理工大学;2009年
5 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
6 何静媛;RNA二级结构预测算法的研究[D];重庆大学;2009年
7 李伦波;自然场景下交通标志的检测与分类算法研究[D];哈尔滨工业大学;2008年
8 陈宝文;蚁群优化算法在车辆路径问题中的应用研究[D];哈尔滨工业大学;2009年
9 王开义;基于支持向量机的农产品生产关键控制点发现研究[D];北京工业大学;2011年
10 沈传河;金融问题中的支持向量机应用研究[D];山东科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 朱健康;基于支持向量机的音乐自动分类[D];天津大学;2010年
2 江锋;支持向量机在分类及人脸检测应用中的研究[D];南京理工大学;2003年
3 朱晓芳;基于支持向量机的田间杂草识别方法研究[D];江苏大学;2010年
4 黄文艳;支持向量机与指纹分类算法研究[D];河北工业大学;2003年
5 张楠;基于支持向量机的车牌汉字识别方法的研究[D];长春理工大学;2010年
6 车志富;基于支持向量机的行人检测[D];北京交通大学;2010年
7 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
8 丁胜;基于支持向量机的手写体字符识别[D];青岛大学;2006年
9 蔡磊;SVM及其扩展算法在图像处理中的应用研究[D];西安石油大学;2010年
10 易潇;基于支持向量机的新闻自动分类技术的研究与应用[D];东北大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026