收藏本站
《少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于混淆网络和PageRank的Nbest重排序

李文  李淼  张建  朱海  陈雷  
【摘要】:本文以汉蒙统计机器翻译系统为研究对象,介绍了基于混淆网络和PageRank的Nbest重排序方法。不同于以多个翻译系统为输入的系统融合技术,本文充分利用了单一系统的Nbest输出。在单一系统Nbest基础上构建基于TER词对齐的混淆网络,然后通过PageRank排序算法输出最终的翻译结果。该方法利用了词级别的TER词对齐的混淆网络生成更多新的候选翻译选项,将最佳翻译结果的搜索问题视作网页间的PR值的计算问题。实验显示,基于混淆网络和PageRank的Nbest重排序方法提高了翻译结果的质量,BLEU值由最大后验概率解码的0.2071提高到0.2225,提高了1.54。

【相似文献】
中国重要会议论文全文数据库 前10条
1 李文;李淼;张建;朱海;陈雷;;基于混淆网络和PageRank的Nbest重排序[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 蔺继国;徐锡山;;一种基于用户点击数据的个性化PageRank算法[A];第六届全国信息检索学术会议论文集[C];2010年
3 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
6 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 杨磊;束罡;牛振东;;基于引力模型的链接分析(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 刘强国;左志宏;董祥千;;基于WEB超链接分析算法的研究综述[A];四川省通信学会2006年学术年会论文集(二)[C];2006年
9 冯迪;李晋宏;曹原;;基于网页的数据挖掘研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 黄云平;孙乐;李文波;;基于上下文图模型文本表示的文本分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国重要报纸全文数据库 前10条
1 本报记者 马文方;匠心在胸[N];中国计算机报;2008年
2 喻宁;群雄逐鹿搜索经济[N];经理日报;2004年
3 文/大海;微软亚研院“微妙转向”[N];计算机世界;2004年
4 复旦大学国际政治系博士 沈逸;谷歌的权力与生意[N];东方早报;2010年
5 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;实验与实用系统[N];计算机世界;2003年
6 本报记者 王翌;Google的左手[N];计算机世界;2004年
7 文/老鬼阿定;微软搜索灵不灵?[N];计算机世界;2004年
8 本报实习记者 田娴;三大搜索引擎角逐中国市场[N];通信信息报;2004年
9 北京 窦芳芳;给IE加上Google搜索工具条[N];电脑报;2001年
10 飘零雪;内嵌浏览器插件,Google搜索直达[N];中国电脑教育报;2004年
中国博士学位论文全文数据库 前8条
1 王菁华;文本中知识的获取[D];北京邮电大学;2008年
2 李方涛;基于产品评论的情感分析研究[D];清华大学;2011年
3 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
4 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
5 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
6 高旻;基于计算语用学和项目的资源协同过滤推荐研究[D];重庆大学;2010年
7 宣云干;基于潜在语义分析的社会化标注系统标签语义检索研究[D];南京大学;2011年
8 朱天;社会网络中节点角色以及群体演化研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 姜玥旭;PageRank算法的改进及在生物网络数据上的应用[D];吉林大学;2012年
2 赵波;PageRank算法在非网页检索问题中的应用[D];复旦大学;2010年
3 刘先明;基于链接分析的PageRank排序算法的改进研究[D];湖北工业大学;2010年
4 袁方;基于改进PageRank算法的个性化搜索的研究[D];北京邮电大学;2012年
5 田浩;基于PageRank值的文本相似度改进模型[D];湖北工业大学;2010年
6 郭庆宝;基于PageRank的搜索引擎优化方法研究[D];山东师范大学;2012年
7 县小平;搜索引擎PageRank算法研究[D];西北大学;2010年
8 高宝军;Web结构挖掘中PageRank算法优化研究[D];兰州大学;2011年
9 谢月;网页排序中PageRank算法和HITS算法的研究[D];电子科技大学;2012年
10 陈谦;一种基于PageRank算法的孤立点检测方法及应用[D];暨南大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026