收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于层叠隐马尔可夫模型的中文命名实体识别

俞鸿魁  张华平  刘群  吕学强  施水才  
【摘要】:本文提出了一种基于层叠隐马尔可夫模型的中文命名实体一体化识别方法,旨在将人名识别、地名识别以及机构名识别等命名实体识别融合到一个相对统一的理论模型中。首先在词语粗切分的结果集上,采用底层隐马尔可夫模型识别出普通无嵌套的人名、地名和机构名等,然后依次采取高层隐马尔可夫模型识别出嵌套了人名、地名的复杂地名和机构名。在对大规模真实语料库的封闭测试中,人名、地名和机构识别的F-1值分别达到92.55%、94.53%、 86.51%。采用该方法的系统ICTCLAs在2003年5月SIGHAN举办的第一届汉语分词大赛中名列前茅,取得了很好的成绩。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 姜文志;顾佼佼;丛林虎;;CRF与规则相结合的军事命名实体识别研究[J];指挥控制与仿真;2011年04期
2 刘晓娟;;基于Lucene的中文兴趣点名称的切分与匹配研究[J];电脑知识与技术;2011年21期
3 方莹;;C-CRF模型在农作物名识别中的应用[J];广东农业科学;2011年06期
4 王全剑;李芳;;基于Wikipedia的人名简历信息抽取[J];计算机应用与软件;2011年07期
5 邢美凤;过仕明;;文本内容新颖性探测研究综述[J];情报科学;2011年07期
6 赵洁;刘彦宏;金培权;;基于互联网的商业机构名识别研究[J];情报学报;2011年08期
7 孙中友;李培峰;朱巧明;;事件信息抽取中的数据预处理方法研究[J];计算机应用与软件;2011年08期
8 谭魏璇;孔芳;倪吉;周国栋;;基于混合统计模型的中文基本名词短语识别[J];计算机应用与软件;2011年08期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
2 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
3 李渝勤;孙丽华;;面向互联网舆情的热词分析技术[A];第六届全国信息检索学术会议论文集[C];2010年
4 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
5 齐振宇;赵军;杨帆;;一种开放式中文命名实体识别的新方法[A];第五届全国信息检索学术会议论文集[C];2009年
6 翟海军;郭嘉丰;王小磊;许洪波;;基于用户查询日志的命名实体挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 向晓雯;史晓东;曾华琳;;一个统计与规则相结合的中文命名实体识别系统[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 张祝玉;任飞亮;朱靖波;;基于条件随机场的中文命名实体识别特征比较研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 李治国;周俏丽;;在篇章中面向产品类的命名实体识别研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
2 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
3 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
4 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
5 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
6 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
7 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
8 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
9 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
10 汤步洲;序列标注问题的监督学习方法及应用[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 张佳宝;基于条件随机场的中文命名实体识别研究[D];国防科学技术大学;2010年
2 杨晓东;中文命名实体识别及若干相关问题的研究[D];江苏大学;2010年
3 周昆;基于规则的命名实体识别研究[D];合肥工业大学;2010年
4 张祝玉;基于条件随机场的中文命名实体识别[D];东北大学;2009年
5 孙静;基于组合分类器的生物命名实体识别[D];大连理工大学;2010年
6 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
7 江超男;面向社会网络应用的关系抽取研究[D];南京理工大学;2010年
8 蓝雁玲;基于多模板HMM的中文命名实体识别[D];华南理工大学;2011年
9 陈扬;基于命名实体识别的学科智能答疑模型研究[D];东北师范大学;2010年
10 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978