收藏本站
《中国计算语言学研究前沿进展(2009-2011)》2011年
收藏 | 手机打开
二维码
手机客户端打开本文

全词消歧的序列标注方法

周云  王挺  易绵竹  王之元  
【摘要】:全词消歧(All-Words Word Sense Disambiguation)本质上是一个序列标注问题,本文提出了两种用于全词消歧的序列标注方法,它们分别基于隐马尔可夫模型(Hidden Markov Model,HMM)和最大熵马尔可夫模型(MaximumEntropy Markov Model,MEMM)模型。首先,我们用HMM对全词消歧进行建模。然后,针对HMM只能利用观察值的缺点,我们将上述HMM模型推广为MEMM模型,将大量上下文特征集成到模型中。对于全词消歧这类超大状态问题,在HMM和MEMM模型中均存在数据稀疏和时间复杂度过高的问题,我们通过柱状搜索Viterbi算法和平滑策略来解决。最后,我们在Senseval-2和Senseval-3的数据集上进行了评测,本文提出的MEMM方法的性能超过该评测上所有的序列标注方法。

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 ;《实验科学与技术》投稿格式模板[J];实验科学与技术;2011年04期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 周云;王挺;易绵竹;王之元;;全词消歧的序列标注方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 周晓;李超;胡明涵;王会珍;;基于人物互斥属性的中文人名消歧[A];第六届全国信息检索学术会议论文集[C];2010年
3 李丽;孙甲申;王小捷;李江;宋占江;;基于属性信息的中文人名消歧[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
5 时迎超;王会珍;肖桐;胡明涵;;面向人名消歧任务的人名识别系统[A];第六届全国信息检索学术会议论文集[C];2010年
6 丁海波;肖桐;朱靖波;;基于多阶段的中文人名消歧聚类技术的研究[A];第六届全国信息检索学术会议论文集[C];2010年
7 冯志伟;;机器翻译系统消歧功能测试[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 杨晓安;;“没有VP的NP”型结构消歧的韵律手段[A];第九届中国语音学学术会议论文集[C];2010年
9 邹红建;杨尔弘;;以事件标注为核心的语篇标注研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 方向红;宋春阳;;介连兼类词“以”的句法语义区别特征及消歧策略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前10条
1 张素芳 译 陈永伶 校;《消歧公约》面临新挑战[N];中国妇女报;2000年
2 通讯员 黎军见习记者 陈恩挚;液态奶新标注方法今年起实施[N];杭州日报;2008年
3 北京科技大学法律系副教授 王竹青;《消歧公约》与中国司法实践[N];中国妇女报;2010年
4 蒋德;南京将统一公共信息标志[N];江苏科技报;2008年
5 本报记者木佳;私企难入农业科研门[N];中华工商时报;2003年
6 本报记者 王春霞;性别平等有助实现全面建设和谐社会[N];中国妇女报;2007年
7 王旭辉;《食品标识管理规定》9月1日起实施[N];中国消费者报;2008年
8 朱英;食品包装“营养”“强化”不能随便标[N];中国特产报;2008年
9 王旭辉;食品标识新规9月1日实施[N];中国信息报;2008年
10 ;《食品标识管理规定》对标识内容的规定[N];中国质量报;2008年
中国博士学位论文全文数据库 前10条
1 芮晓光;真实世界环境下的自动图像标注方法研究[D];中国科学技术大学;2010年
2 罗旺;遥感图像的变化检测与标注方法研究[D];电子科技大学;2012年
3 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
4 王梅;基于多标签学习的图像语义自动标注研究[D];复旦大学;2008年
5 虎晓红;用于图像检索的语义标注技术的研究[D];中国矿业大学(北京);2010年
6 许红涛;Web图像语义分析与自动标注研究[D];复旦大学;2009年
7 宋彦;视频语义标注方法和理论的研究[D];中国科学技术大学;2006年
8 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
9 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
10 荚济民;基于互联网数据集的图像标注技术研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 李超;面向新闻领域的人名消歧方法研究[D];东北大学;2010年
2 裴飞;基于聚类的英汉人名消歧研究[D];苏州大学;2011年
3 沈剑平;面向网络人物搜索的中文人名消歧[D];哈尔滨工业大学;2010年
4 李丽;基于属性信息的中文人名消歧研究[D];北京邮电大学;2012年
5 舒平芬;个性化搜索中用户语义意图自动识别技术研究[D];东北大学;2008年
6 高琦;基于Bootstrapping的本体标注方法研究[D];重庆大学;2010年
7 王英帅;Web人名消歧方法的研究与实现[D];苏州大学;2010年
8 唐博蓉;基于维基百科的命名实体消歧研究[D];北京理工大学;2011年
9 叶君梅;英汉机器翻译中的歧义及消歧策略[D];广西师范大学;2002年
10 戴祥鹰;文本聚类在话题检测与人名消歧中的应用研究[D];哈尔滨工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026