基于字词混合翻译短语的统计机器翻译
【摘要】:汉英翻译中的分词影响着统计机器翻译(SMT)性能。为解决分词工具对SMT产生的影响,本文提出了一种基于字词混合翻译短语的方法。它将基于分字和分词的两种方法进行有效融合,缓解了分词带来的不利影响。本文在汉英科技专利文献上进行了实验,表明这种混合策略相比单一的分词的性能最高可以提升0.56的BLEU分数,并发现使得SMT最优化的分词工具的平均分词长度应该在1.57~1.61字/词之间。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||
|