收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于信息增益改进贝叶斯词义消歧模型

邓宾  余正涛  韩露  车文刚  郭剑毅  
【摘要】:词义消歧是自然语言处理的关键问题。本文通过信息增益的方法,统计出歧义词上下文各个位置对岐义词词义的影响,以此为基础,选取影响岐义词前后6个位置词构建词义消歧特征向量,采用贝叶斯算法,通过信息增益为特征向量12维特征赋予不同的权重值,从而改进了贝叶斯消歧模型。采用知网义项来描叙岐义词词义,对10个汉语常用歧义词进行消歧测试实验,结果证明该方法有效,其中封闭测试正确率达95.72%,开放测试正确率达85.71%。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 ;日本图书情报大学的课程[J];现代图书情报技术;1981年02期
2 沈迪飞;;一门新兴的实验学科——情报检索[J];情报科学;1981年02期
3 Peter Wegner;饶生忠;;软件技术研究方向[J];计算机科学;1981年02期
4 怡林;中国中文信息研究会召开新春学术座谈会[J];计算机研究与发展;1983年04期
5 耿立大;;自然语言信息加工和人工智能[J];情报科学;1983年04期
6 爱德华·A德格里戈略;叶自健;;适用于潜艇作战指挥环境的基于知识的系统——用自然语言对话的人/机系统指挥控制[J];火力与指挥控制;1983年04期
7 钱锋;;计算机科学与机器翻译的相互影响[J];计算机科学;1983年03期
8 ;《中文信息》已于十月创刊[J];微计算机应用;1984年04期
9 陆玉昌,张再兴;第六届欧洲人工智能会议论文综述[J];机器人;1985年06期
10 丁自;情报检索的未来方向(续)[J];情报杂志;1985年04期
中国重要会议论文全文数据库 前10条
1 林耀燊;李文捷;黄绵辉;;信息检索系统中的自然语言处理[A];复杂巨系统理论·方法·应用——中国系统工程学会第八届学术年会论文集[C];1994年
2 陆汝占;靳光瑾;;寻求对外汉语教学和计算机共同适用的语义解释方法[A];第五届国际汉语教学讨论会论文选[C];1996年
3 胡健;黄丽华;刘杰;;基于自然语言的智能决策支持系统人机接口[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年
4 陈敏;;应用DCG文法分析汉语[A];语言文字应用研究论文集(Ⅰ)[C];1995年
5 陈小平;郑诚;刘贵全;;意图形式化研究的若干问题[A];逻辑今探——中国逻辑学会第五次代表大会暨学术讨论会论文集[C];1996年
6 汪华峰;陈峪;;汉语自然语言理解中词切分中新词问题初探[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
7 戴礼荣;;人机语声对话特点及系统设计[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 张树武;徐波;黄泰翼;;汉语大词汇/连续语音识别语言建模技术分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年
9 徐波;高文;黄泰翼;;口语自动翻译及其最新进展-CSTAR-Ⅱ'98概况[A];第五届全国人机语音通讯学术会议论文集[C];1998年
10 徐晓霞;席酉民;汪应洛;;自然语言处理与GDSS的研究[A];1996中国控制与决策学术年会论文集[C];1996年
中国博士学位论文全文数据库 前10条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
2 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
3 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
4 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
5 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
6 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
7 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
8 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
9 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
10 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 李波;一种基于统计的汉语多义词排歧方法[D];大连理工大学;2000年
2 高建忠;汉语动宾搭配的自动识别研究[D];北京语言文化大学;2000年
3 黄元萃;汉语基本名词短语的自动识别模型[D];大连理工大学;2001年
4 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
5 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
6 郑旭玲;面向机器翻译的汉语短语语义模式规则研究[D];厦门大学;2002年
7 叶君梅;英汉机器翻译中的歧义及消歧策略[D];广西师范大学;2002年
8 赵志刚;遗传算法在决策支持系统智能化过程中的应用研究[D];河北工业大学;2002年
9 张爱民;自然语言处理及其智能搜索引擎模型的设计研究[D];兰州理工大学;2003年
10 詹思瑜;自然语言的计算机处理模型[D];电子科技大学;2003年
中国重要报纸全文数据库 前10条
1 军涛;跨越语言障碍沟通无疆界[N];科技日报;2000年
2 TurboCRM咨询总监 李蓓;知识管理会成为CRM的基石吗[N];中国计算机报;2001年
3 本报记者 叶武滨;能看会想 能听会讲[N];人民邮电;2001年
4 康乐;漫谈搜索引擎技术[N];中国化工报;2002年
5 樊永梅 编译;CRM成就自助服务[N];计算机世界;2002年
6 本报记者 顾洪文;TRS:内容管理 创造价值[N];计算机世界;2002年
7 ;开天辟地第一回[N];计算机世界;2002年
8 ;从CRM到KRM[N];上海金融报;2002年
9 ;IBM将AI引入非结构化数据存储[N];中国计算机报;2003年
10 郑惠荣;利用人工智能进行邮件过滤[N];中国计算机报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978