收藏本站
《第六届全国信息检索学术会议论文集》2010年
加入收藏

基于中心语匹配的共指消解

黎耀炳  张牧宇  秦兵  刘挺  
【摘要】:共指消解是自然语言处理的核心任务之一。在传统机器学习方法使用的平面特征基础上,本文提出一种利用中心语信息的新方法。该方法首先引进一种基于简单平面特征的实例匹配算法用于共指消解。在此基础上,又引入了先行语与照应语的中心语字符串作为新特征,并提出一种竞争模式对将中心语约束融合进实例匹配算法,提升了消解效果。该方法与其他只使用平面特征的传统机器学习方法相比,能充分地利用每一个训练实例的特征信息,进一步融合中心语字符串特征使消解效果更加准确。
【作者单位】:哈尔滨工业大学计算机学院信息检索研究中心
【关键词】:中心语匹配 实例匹配 共指消解
【基金】:国家自然科学基金面上项目(60975055) 863计划探索类专题项目(2008AA01Z144)资助
【分类号】:TP391.1
【正文快照】:
引言现实世界中同一个事物经常会有不同的名称以及描述,我们称这些名称以及描述称为“表述”(Mention),称这些表述所对应的事物为“实体”(Entity)。所谓的共指消解(eo一rerer‘:neeResolution),就是根据一篇文档中各个表述的内容以及上卜文信息将这些表述对应到具体实体

【参考文献】
中国期刊全文数据库 前2条
1 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
2 郎君;忻舟;秦兵;刘挺;李生;;集成多种背景语义知识的共指消解[J];中文信息学报;2009年03期
【共引文献】
中国期刊全文数据库 前10条
1 何甫权;;英语指代与翻译[J];安徽文学(下半月);2008年08期
2 杨凯;;浅谈指代消解[J];硅谷;2008年24期
3 吴敏;;指代消解在普通语言学理论与课程实践上的应用研究[J];大家;2010年11期
4 李莎莎;李舟军;陈火旺;;篇章中的消解问题与消解算法:研究综述[J];计算机科学;2007年07期
5 李艳翠;杨勇;周国栋;朱巧明;;基于支持向量机的英语名词短语指代消解[J];计算机工程;2009年03期
6 李国臣,罗云飞;采用优先选择策略的中文人称代词的指代消解[J];中文信息学报;2005年04期
7 周俊生;黄书剑;陈家骏;曲维光;;一种基于图划分的无监督汉语指代消解算法[J];中文信息学报;2007年02期
8 冯元勇;孙乐;董静;李文波;;基于分类信心重排序的中文共指消解研究[J];中文信息学报;2007年06期
9 庞宁;杨尔弘;;基于最大熵模型的共指消解研究[J];中文信息学报;2008年02期
10 宋巍;秦兵;郎君;刘挺;;句法与词义相结合的中文代词消解[J];中文信息学报;2008年06期
中国重要会议论文全文数据库 前7条
1 梅铮;王厚峰;;汉语人称代词消解的前端处理[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 郎君;秦兵;刘挺;李生;;中国人名性别自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
3 宋巍;秦兵;郎君;刘挺;;句法与词义相结合的中文代词消解[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 王海东;谭魏旋;周国栋;;语义角色在指代消解中的研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 谢永康;周雅倩;黄萱菁;;一种基于谱聚类的共指消解方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 刘茂福;金可佳;姬东鸿;张晓龙;;统计与规则相结合的指代消解在事件自动文摘中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 付瑞吉;秦兵;刘挺;;面向音乐领域的文本检索与挖掘系统[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 孔芳;指代消解关键问题研究[D];苏州大学;2009年
2 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年
3 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
4 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
5 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
6 翁依琴;汉语零形回指的认知研究[D];复旦大学;2006年
7 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
8 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
9 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
10 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 宋巍;基于句法特征的代词消解方法研究[D];哈尔滨工业大学;2008年
2 胡乃全;基于特征向量的中文指代消解研究与系统实现[D];苏州大学;2009年
3 陆长生;中文跨文档指代消解的研究与实现[D];苏州大学;2010年
4 黄李伟;中文零指代消解研究[D];苏州大学;2010年
5 谭魏璇;命名实体与基本名词短语识别研究[D];苏州大学;2010年
6 肖欣延;基于词汇链和PageRank的多文档自动文摘研究[D];厦门大学;2008年
7 陈禹;基于语篇的中文命名实体识别研究[D];厦门大学;2008年
8 王海东;基于树核的代词消解研究[D];苏州大学;2009年
9 谢永康;一种基于谱聚类的共指消解方法[D];复旦大学;2009年
10 陈睿扬;面向体育新闻领域的中文简单名词短语共指消解[D];南京理工大学;2009年
【二级参考文献】
中国期刊全文数据库 前3条
1 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
2 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
3 张钹;;自然语言处理的计算模型[J];中文信息学报;2007年03期
【相似文献】
中国期刊全文数据库 前10条
1 高善群;;如何做好“三农”电视报道[J];现代视听;2010年S2期
2 周俊生;黄书剑;陈家骏;曲维光;;一种基于图划分的无监督汉语指代消解算法[J];中文信息学报;2007年02期
3 李元龙;周俊生;陈家骏;;一种基于关联聚类的汉语共指消解方法[J];计算机科学;2007年12期
4 马晶文;词汇重复模式在写作教学应用的尝试[J];甘肃科技纵横;2005年01期
5 刘其云,李中言;信息抽取的功能和实现方法[J];情报杂志;2005年05期
6 刘剑兰,朱东华;信息抽取技术在情报监测中的应用[J];情报学报;2004年06期
7 谷和启;网闸在网络安全中的应用[J];当代通信;2004年22期
8 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
9 孙斌;信息提取技术概述(下)[J];术语标准化与信息技术;2003年01期
10 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
中国重要会议论文全文数据库 前5条
1 黎耀炳;张牧宇;秦兵;刘挺;;基于中心语匹配的共指消解[A];第六届全国信息检索学术会议论文集[C];2010年
2 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
3 史树敏;黄河燕;;基于领域本体的指代消解策略研究(英文)[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
4 王菁华;刘建毅;王枞;;语义网络结构下的词义消歧[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
5 司富珍;;链式事件结构分析[A];第38届国际汉藏语会议论文提要[C];2005年
中国重要报纸全文数据库 前10条
1 通讯员 蒋辉;阿克陶“村民事务代办制”让群众心里乐[N];克孜勒苏报;2008年
2 朱其俊;自治区粮食局表彰粮食系统抗灾救灾先进集体和个人[N];广西日报;2008年
3 楚良;湖北三措并举稳定市场供应[N];粮油市场报;2008年
4 潘双清;2万吨柴油可保“三夏”无忧[N];石家庄日报;2008年
5 徐伟;旅客在台停留时间不超过10天[N];法制日报;2008年
6 本报记者 刘盈蓉 通讯员 胡罡;法律援助成为弱势群体保护神[N];湘潭日报;2008年
7 廖小兵 郑天君;广安区农资打假动真格[N];广安日报;2006年
8 晓月;美国瑞维尼亚音乐节任命新总监[N];音乐周报;2005年
9 记者 卢怀谦;全国保监局多半实现非现场监管[N];中国证券报;2004年
10 大山;河北沙河铁矿特大矿难灾难的背后是可怕[N];中华合作时报;2004年
中国博士学位论文全文数据库 前2条
1 王道英;“这”、“那”的指示研究[D];上海师范大学;2003年
2 黄东晶;俄汉代词指示语对比研究[D];黑龙江大学;2001年
中国硕士学位论文全文数据库 前7条
1 许荣华;面向话题的事件信息融合研究与实现[D];苏州大学;2009年
2 宋巍;基于句法特征的代词消解方法研究[D];哈尔滨工业大学;2008年
3 高娜;汉语的衔接性重复在英语中的表现[D];上海海事大学;2007年
4 赵凤娟;中国二语学习者英语口头叙述中重复的使用特征研究[D];扬州大学;2006年
5 狄梅;间接回指:其认知阐释及对体裁的影响[D];苏州大学;2004年
6 仰鑫;约束理论与汉语中的反身代词[D];安徽师范大学;2003年
7 苗慧;英汉语篇词汇衔接模式[D];东北师范大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026