收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

统计机器翻译中短语切分的新方法

何中军  刘群  林守勋  
【摘要】:基于短语的统计机器翻译是目前主流的一种统计机器翻译方法,但是目前基于短语的翻译系统都没有对短语切分作专门处理,认为一个句子的所有短语切分都是等概率的。本文提出了一种短语切分方法,将句子的短语切分概率化:首先,识别出汉语语料库中所有出现次数大于2次的词语串,将其作为汉语短语;其次,用最短路径方法进行短语切分,并利用Viterbi 算法迭代统计短语的出现频率。在2005年863汉英机器翻译评测测试集上的实验结果(bleu4)是:0.1764(篇章),0.2231(对话)。实验表明,对于长句子(如篇章),短语切分模型的加入有助于提高翻译质量,比原来约提高了0.5个百分点。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 姜迎春;雪艳;;词语对齐与机器翻译问题研究——以汉蒙机器翻译为例[J];民族翻译;2010年01期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 董兴华;周俊林;郭树盛;吐尔洪·吾司曼;;基于短语的汉维(维汉)统计机器翻译研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 何中军;刘群;林守勋;;统计机器翻译中短语切分的新方法[A];第三届学生计算语言学研讨会论文集[C];2006年
3 熊皓;刘洋;刘群;;模糊匹配在树到串翻译模型中的应用[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 蒋俊杰;徐金安;张玉洁;;北京交通大学CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 于惠;谢军;熊皓;吕雅娟;刘群;林守勋;;基于篇章上下文的统计机器翻译方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 朱海;李淼;张建;乌达巴拉;;系统融合方法在汉蒙统计机器翻译上的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
8 巢文涵;李舟军;;ZZX_MT系统CWMT2011评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
9 于东;贾磊;徐波;;面向语音识别错误恢复的澄清式疑问句生成[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 姚树杰;肖桐;朱靖波;;基于句对质量和覆盖度的统计机器翻译训练语料选取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 段楠;统计机器翻译的一致性解码方法研究[D];天津大学;2012年
2 蒋宏飞;基于同步树替换文法的统计机器翻译方法研究[D];哈尔滨工业大学;2010年
3 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
4 黄书剑;统计机器翻译中的词对齐研究[D];南京大学;2012年
5 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
6 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
7 陈毅东;基于短语的统计机器翻译模型若干关键技术研究[D];厦门大学;2008年
8 蔡柯柯;基于查询特征上下文的检索模型研究[D];浙江大学;2007年
9 王博;机器翻译系统的自动评价及诊断方法研究[D];哈尔滨工业大学;2010年
10 薛永增;统计机器翻译若干关键技术研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 崔磊;关于层次短语翻译模型调序问题的研究[D];哈尔滨工业大学;2010年
2 许冲;统计机器翻译中层次短语翻译模型的研究与实现[D];哈尔滨工业大学;2010年
3 李文;形态非对称汉蒙统计机器翻译模型构造方法研究[D];中国科学技术大学;2011年
4 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
5 张育;基于依存语法的统计机器翻译研究[D];苏州大学;2011年
6 宝美荣;融入形态学分析的汉蒙统计机器翻译研究[D];内蒙古师范大学;2012年
7 任高举;基于短语的翻译模型中汉维短语抽取的研究[D];新疆大学;2010年
8 宋美娜;基于词缀特征的汉蒙统计机器翻译系统[D];内蒙古大学;2010年
9 张春越;统计机器翻译中树到串对齐模板模型系统实现和比较研究[D];哈尔滨工业大学;2010年
10 王志杰;统计机器翻译系统在手持设备上的研究与实现[D];内蒙古大学;2012年
中国重要报纸全文数据库 前1条
1 周滢;走向新时代[N];中国邮政报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978