收藏本站
《中国计算语言学研究前沿进展(2009-2011)》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

自动词性标注中语法因素和词汇因素对英汉语的不同影响

邢富坤  宋柔  
【摘要】:本文使用词性自动标注模型对影响英汉语词性标注的相关因素进行定量研究,进而探究词汇因素与语法因素各自对英汉语词性标注的影响,目的是为深入分析英汉语在词类问题上的差别,更好地构建汉语语料库提供参考依据。本文将词汇因素近似地形式化为词汇发射概率和词汇最大词性概率,语法因素近似地形式化为词性转移概率,并利用隐马尔科夫模型、马尔科夫模型和词汇最大概率模型进行自动标注实验。通过比较不同模型的标注准确率,发现语法因素对于英语词性标注的影响显著大于汉语,词汇因素对汉语词性标注的影响显著大于英语。在英汉语内部,英语的词的核心语义因素与句法因素对词性标注的影响基本相仿;而汉语的词的核心语义因素对词性标注的影响显著高于句法因素。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 丁玉忠;吾守尔·斯拉木;那斯尔江·吐尔逊;;基于垃圾模型的维吾尔语关键词识别[J];现代计算机(专业版);2011年12期
2 岑咏华;韩哲;季培培;;基于隐马尔科夫模型的中文术语识别研究[J];现代图书情报技术;2008年12期
3 温锁林;;从词性标注看小句的中枢地位[J];汉语学报;2004年01期
4 朱东来,王仁华,凌震华,李威;基于隐马尔科夫模型的汉语韵律词基频模型[J];声学学报(中文版);2002年06期
5 黄昌宁;关于处理大规模真实文本的谈话[J];语言文字应用;1993年02期
6 陈群秀;1995年全国第三届计算语言学联合学术会议评介[J];语言文字应用;1996年01期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前3条
1 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 吾守尔·斯拉木;;前言[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 加米拉·吾守尔;吐尔根·依不拉音;;现代维吾尔语语言资源平台构建技术的研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国博士学位论文全文数据库 前1条
1 王志栋;语用要点识别模型研究[D];清华大学;2008年
中国硕士学位论文全文数据库 前2条
1 苏俊峰;基于HMM的藏语语料库词性自动标注研究[D];西北民族大学;2010年
2 羊毛卓么;藏文词性自动标注系统的研究与实现[D];西藏大学;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978