收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

隐马尔可夫模型和贝叶斯模型词义消歧对比研究

丁江伟  刘挺  卢志茂  李生  
【摘要】:词义消歧是自然语言处理中的一个难点和热点问题。现阶段,多义词消歧的研究大多采用几个有代表性的歧义词作为研究与测试的对象,与实际应用还存在一定的距离,作者针对真实的应用情况,对大规模文本进行了词义消歧研究。本文比较了两个经典的统计模型解决大规模的词义消歧难题的优缺点,一阶隐马尔可大模型考察了邻接的上下文,有些时候距离歧义词较远的词语往往对词义的确定起着至关重要的作用,所以这种方法的消歧正确率比较低,开放测试在85%左右;单纯贝叶斯概率模型的消歧方法在抽取上下文特征时加大了上下文的窗口,使与多义词消歧相关的信息充分考虑进来,这种方法的开放消歧正确率最高可达92%,消歧效果明显。由此证明了贝叶斯模型词义消歧的有效性和比较优势。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王达;张坤;;贝叶斯模型在词义消歧中的应用[J];计算机时代;2009年07期
2 范冬梅;卢志茂;张汝波;潘树燊;;基于信息增益改进贝叶斯模型的汉语词义消歧[J];电子与信息学报;2008年12期
3 胡蓉;词义消歧方法初探[J];洛阳工业高等专科学校学报;2005年01期
4 刘挺;卢志茂;李生;;一个全文词义自动标注系统的实现[J];哈尔滨工业大学学报;2005年12期
5 周顺先;林亚平;王耀南;;基于主动学习隐马尔可夫模型的文本信息抽取[J];湖南大学学报(自然科学版);2007年06期
6 程开东;栾方军;马驷良;;一种基于隐马尔可夫模型的在线手写签名认证算法[J];吉林大学学报(理学版);2008年05期
7 王鹏程;;词性标注中隐马尔可夫模型的改进[J];河南财政税务高等专科学校学报;2009年04期
8 刘亚清;陈荣;;基于隐马尔可夫模型的Web信息抽取[J];计算机工程;2009年18期
9 陈博逊;黄晶晓;;一种基于HMM和CRF的双层分词模型[J];硅谷;2009年22期
10 王可,王翠梅;语音识别中的归一化状态持续时间隐马尔可夫模型(英文)[J];四川大学学报(自然科学版);1999年05期
11 史东承,杨冬,姜文翰,周小飞;一种基于隐马尔可夫模型的人像识别算法[J];长春工业大学学报(自然科学版);2002年S1期
12 向晓雯,史晓东,曾华琳;一个统计与规则相结合的中文命名实体识别系统[J];计算机应用;2005年10期
13 杜修平;何丕廉;;基于语音识别的自动标绘系统设计与实现[J];计算机工程;2006年13期
14 罗双虎;欧阳为民;;基于隐Markov模型的文本分类[J];计算机工程与应用;2007年30期
15 常军林;吴笑伟;吴芬芬;刘磊;;基于特征和隐马尔可夫模型的文本信息抽取[J];河南科技大学学报(自然科学版);2008年02期
16 方浩;许鸿文;蔡益宇;;一种基于语义关系改进的隐马尔可夫模型研究[J];通信技术;2008年05期
17 罗泽举;宋丽红;;隐马尔可夫模型的多序列比对研究[J];计算机工程与应用;2010年07期
18 屈刚,陆汝占;一个改进的汉语词性标注系统[J];上海交通大学学报;2003年06期
19 席素梅;高茜;徐鑫;;浅谈基于改进贝叶斯模型的词义消歧方法[J];山东轻工业学院学报;2006年03期
20 于江德;樊孝忠;尹继豪;顾益军;;基于隐马尔可夫模型的中文科研论文信息抽取[J];计算机工程;2007年19期
中国重要会议论文全文数据库 前10条
1 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 邓宾;余正涛;韩露;车文刚;郭剑毅;;基于信息增益改进贝叶斯词义消歧模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 陈建美;林鸿飞;杨志豪;;基于贝叶斯模型的词汇情感消歧[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
7 何径舟;王厚峰;;基于特征自动选取的汉语词义消歧[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 秦颖;王小捷;;组合中文词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 费玉莲;凌云;王勋;;基于增强隐马尔可夫模型的视频数据挖掘研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
10 张宇;刘挺;文勖;;基于改进贝叶斯模型的问题分类[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 李杰;隐马尔可夫模型的研究及其在图像识别中的应用[D];清华大学;2004年
3 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
4 刘小军;人脸识别技术研究[D];中国科学院电子学研究所;2001年
5 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
6 王菁华;文本中知识的获取[D];北京邮电大学;2008年
7 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
8 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
9 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
10 栾方军;在线手写签名认证算法的研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前10条
1 徐赟;基于知网和贝叶斯模型的词义消岐技术的研究[D];南京理工大学;2010年
2 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
3 史俊冰;问答系统中词义消歧与关键词扩展研究[D];太原理工大学;2011年
4 詹靓雯;基于知网的中文词义消歧研究[D];中国计量学院;2012年
5 凌广杰;基于分段半马尔可夫模型的在线序列模式检测方法研究[D];浙江大学;2006年
6 徐欣;基于HMM的中医临床疗效评价分析研究[D];北京交通大学;2009年
7 闫三锋;基于单片机语音识别系统设计[D];西北工业大学;2004年
8 吴芬芬;信息抽取算法研究[D];吉林大学;2006年
9 肖芳;基于混合遗传退火算法的web信息抽取方法研究与实现[D];电子科技大学;2009年
10 张剑;基于CRF的英文命名实体识别研究[D];哈尔滨工业大学;2006年
中国重要报纸全文数据库 前1条
1 晓业;TTS提升基金CIC服务[N];计算机世界;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978