收藏本站
《中国计算机语言学研究前沿进展(2007-2009)》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于字词混合翻译短语的统计机器翻译

万升华  杨沐昀  李生  赵铁军  
【摘要】:汉英翻译中的分词影响着统计机器翻译(SMT)性能。为解决分词工具对SMT产生的影响,本文提出了一种基于字词混合翻译短语的方法。它将基于分字和分词的两种方法进行有效融合,缓解了分词带来的不利影响。本文在汉英科技专利文献上进行了实验,表明这种混合策略相比单一的分词的性能最高可以提升0.56的BLEU分数,并发现使得SMT最优化的分词工具的平均分词长度应该在1.57~1.61字/词之间。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 于江德;谷川;葛文英;樊孝忠;;一种基于字和子串联合标注的汉语分词方法[J];山西大学学报(自然科学版);2011年03期
2 赵晓凡;胡顺义;刘永革;;CRF模型中参数f在字标注汉语分词中的适用性研究[J];郑州大学学报(工学版);2011年04期
3 高东平;;基于类型论的汉语分词系统TTCS[J];重庆理工大学学报(社会科学);2011年08期
4 王志洋;吕雅娟;刘群;;面向形态丰富语言的多粒度翻译融合[J];中文信息学报;2011年04期
5 史晓东;卢亚军;;央金藏文分词系统[J];中文信息学报;2011年04期
6 张利江;郭进利;李松伟;;河南省县级医院网上信息服务现状调查研究[J];价值工程;2011年21期
7 张亚军;;汉语-维吾尔语机器翻译解码器研究[J];昌吉学院学报;2011年03期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 万升华;杨沐昀;李生;赵铁军;;基于字词混合翻译短语的统计机器翻译[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 杜金华;王莎;;西安理工大学统计机器翻译系统技术报告(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 朱海;李淼;张建;乌达巴拉;;系统融合方法在汉蒙统计机器翻译上的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 于惠;谢军;熊皓;吕雅娟;刘群;林守勋;;基于篇章上下文的统计机器翻译方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 梁芳丽;李淼;李文;陈雷;乌达巴拉;;统计机器翻译中的源语言重排序方法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 董兴华;周俊林;郭树盛;吐尔洪·吾司曼;;基于短语的汉维(维汉)统计机器翻译研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 姚树杰;肖桐;朱靖波;;基于句对质量和覆盖度的统计机器翻译训练语料选取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 李响;徐金安;刘群;吕雅娟;姜文斌;;移动终端机器翻译设备的解码定点化方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 巢文涵;李舟军;;ZZX_MT系统CWMT2011评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国重要报纸全文数据库 前1条
1 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 蒋宏飞;基于同步树替换文法的统计机器翻译方法研究[D];哈尔滨工业大学;2010年
2 段楠;统计机器翻译的一致性解码方法研究[D];天津大学;2012年
3 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
4 黄书剑;统计机器翻译中的词对齐研究[D];南京大学;2012年
5 陈毅东;基于短语的统计机器翻译模型若干关键技术研究[D];厦门大学;2008年
6 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
7 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
8 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
9 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
10 王博;机器翻译系统的自动评价及诊断方法研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 李函章;统计机器翻译中语料选择方法研究[D];黑龙江大学;2010年
2 宋美娜;基于词缀特征的汉蒙统计机器翻译系统[D];内蒙古大学;2010年
3 李天宁;词对齐技术研究及统计机器翻译平台的构建[D];东北大学;2009年
4 张涛;面向特定领域的统计机器翻译研究与应用[D];昆明理工大学;2011年
5 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
6 应玉龙;汉蒙词法分析及其在统计机器翻译中的应用[D];中国科学技术大学;2010年
7 蓝翔;采用统计机器翻译模型的复述生成技术研究[D];哈尔滨工业大学;2010年
8 张春越;统计机器翻译中树到串对齐模板模型系统实现和比较研究[D];哈尔滨工业大学;2010年
9 狄萍;基于短语的统计机器翻译的研究[D];苏州大学;2010年
10 李文;形态非对称汉蒙统计机器翻译模型构造方法研究[D];中国科学技术大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978