收藏本站
《第六届全国信息检索学术会议论文集》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于人物互斥属性的中文人名消歧

周晓  李超  胡明涵  王会珍  
【摘要】:本文针对人名消歧任务中,由于歧义人名处于相近领域而区分困难的情况,提出了基于人物属性互斥与非互斥的两阶段人名消歧义方法。该方法的第一阶段,利用领域知识库和启发式规则抽取人物相关属性,包括职业领域、职务、相关实体等,利用这些属性进行人物的初步的聚合与划分,并识别出互斥与非互斥的人物;第二阶段则是在第一阶段的基础上,再进行一次基于主题聚类的人名消歧的过程,得到最终结果。在SIGHAN 2010训练数据上的对比实验中,本文提出的方法,较于单纯基于主题聚类算法的人名消歧,在Purity评价方法中,F值平均提高了2个百分点,在B-Cubed评价方法中,F值平均提高了3个百分点。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨莹,李应潭;基于意象知识的消歧体系[J];中文信息学报;1993年01期
2 汪津,杜德基;英汉机器翻译系统中的消歧策略[J];微型电脑应用;1997年04期
3 刘蓓,杜利民;汉语口语对话系统中语义分析的消歧策略[J];中文信息学报;2005年01期
4 周洪,陈强;基于SC文法的英汉机译中消歧处理的研究[J];北京联合大学学报;1997年03期
5 陈淑珍,卢昌荆,林克明;WEB文本挖掘的中文分词系统的设计与实现[J];三明学院学报;2005年02期
6 范荣;;用融和丰富字特征的不等式平滑最大熵模型消解组合型歧义[J];电脑编程技巧与维护;2011年02期
7 张玥杰;张涛;朱靖波;姚天顺;;面向数据的句法分析消歧[J];计算机科学;2006年03期
8 方俊;郭雷;王晓东;;基于语义的关键词提取算法[J];计算机科学;2008年06期
9 郭雷;方俊;王晓东;;基于WordNet的本体澄清[J];计算机科学;2008年10期
10 周俏丽;蔡东风;吕德新;朱江涛;吴英泽;;基于语义相似度的句法歧义结构消解[J];沈阳航空工业学院学报;2006年01期
11 王忠林;赵启阳;尹宝林;;基于确定信息的直接语法分析[J];中北大学学报(自然科学版);2008年02期
12 张颖颖;谢强;丁秋林;;基于同义词链的中文关键词提取算法[J];计算机工程;2010年19期
13 刘划;;基于最优邻接锚点消歧的词对齐方法[J];沈阳航空工业学院学报;2009年01期
14 齐璇;王挺;姚宏坤;;汉语语义知识的自动获取方法研究[J];计算机工程与科学;2006年11期
15 冯素琴;陈惠明;;一种自组织的汉语组合型歧义消歧方法[J];计算机工程与设计;2007年03期
16 朱洁;;机器翻译中多义词的消歧[J];合肥学院学报(社会科学版);2007年06期
17 谈文蓉;;汉英机器翻译系统中统计消歧的多步策略[J];西南民族大学学报(自然科学版);2006年01期
18 冯素琴;陈惠明;;利用上下文信息解决汉语组合型歧义[J];电脑开发与应用;2007年01期
19 杨宪泽;雷开彬;;句型转换的机器翻译理论模型与一些处理方法[J];科技通报;2007年02期
20 徐哲;刘循;;贝叶斯决策树在英文现在分词词性识别中的应用[J];计算机应用;2009年09期
中国重要会议论文全文数据库 前10条
1 周晓;李超;胡明涵;王会珍;;基于人物互斥属性的中文人名消歧[A];第六届全国信息检索学术会议论文集[C];2010年
2 李丽;孙甲申;王小捷;李江;宋占江;;基于属性信息的中文人名消歧[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
4 时迎超;王会珍;肖桐;胡明涵;;面向人名消歧任务的人名识别系统[A];第六届全国信息检索学术会议论文集[C];2010年
5 丁海波;肖桐;朱靖波;;基于多阶段的中文人名消歧聚类技术的研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 周云;王挺;易绵竹;王之元;;全词消歧的序列标注方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 方向红;宋春阳;;介连兼类词“以”的句法语义区别特征及消歧策略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 李斌;陈小荷;方芳;徐艳华;;高频最大交集型歧义字段问题研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 刘方舟;施勤;陶建华;;基于最大熵模型的多音字消歧[A];第九届全国人机语音通讯学术会议论文集[C];2007年
10 王萌;何婷婷;王晓荣;;基于hownet概念获取的中文自动文摘系统[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 郑志诚;用户查询歧义性分析研究[D];清华大学;2013年
2 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
3 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
4 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
5 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
6 于永新;基于本体的图像语义识别和检索研究[D];天津大学;2009年
7 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
8 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
9 姜丽丽;实体搜索与实体解析方法研究[D];兰州大学;2012年
10 文娟;统计语言模型的研究与应用[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 李超;面向新闻领域的人名消歧方法研究[D];东北大学;2010年
2 宋文强;科技文献作者重名消歧与实体链接[D];哈尔滨工业大学;2012年
3 裴飞;基于聚类的英汉人名消歧研究[D];苏州大学;2011年
4 田维;基于半监督图聚类的专家消歧方法研究[D];昆明理工大学;2013年
5 王鑫;人名消歧关键技术研究与实现[D];哈尔滨工业大学;2012年
6 王沛;文本倾向性分析中的评价对象抽取与消歧研究[D];哈尔滨工业大学;2013年
7 沈剑平;面向网络人物搜索的中文人名消歧[D];哈尔滨工业大学;2010年
8 李丽;基于属性信息的中文人名消歧研究[D];北京邮电大学;2012年
9 朱小婷;基于本体的中文人名消歧[D];华东师范大学;2013年
10 赵凯祺;实体消歧及其在图像搜索中的应用[D];上海交通大学;2013年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978