收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于双语句对语料库的词对齐模型

陈晴  姚天顺  
【摘要】:英汉词对齐技术中经常会遇到非登录词和因汉语的多样性和灵活性而产生的不利因素,直接或间接影响双语句对中词对齐的质量;但其本身具有的信息有利于改善词对齐质量。本文就是希望通过建立基于双语句对语料库的词对齐模型将句对之间的信息加以改进。主要包括:吕学强在其博士论文中提出的最小求交和最小求差模型以及这两种的混合模型(Ⅰ,Ⅱ)。试验得出在特定词频条件下,混和模型(Ⅰ)具有相对较佳的效果,正确率达到0.7862%,召回率达到0.7558%,F1值达到0.7708%。

知网文化
【相似文献】
中国重要会议论文全文数据库 前10条
1 陈晴;姚天顺;;基于双语句对语料库的词对齐模型[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 张孝飞;陈肇雄;黄河燕;张亮;;基于有限资源的双语词对齐算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 吕雅娟;赵铁军;李生;杨沐昀;;统计和词典方法相结合的双语语料库词对齐[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 朱丹青;常宝宝;;一种基于N-Best结果组合优选的词语对齐方法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 任登君;李珩;张俐;姚天顺;;基于词对齐的双语组块对齐[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 肖桐;李天宁;陈如山;朱靖波;王会珍;;面向统计机器翻译的重对齐方法研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 吴宏林;刘绍明;;基于二部图最大匹配的汉日词对齐[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 陈如山;肖桐;朱靖波;;利用1-m词对齐信息改善统计机器翻译性能[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 黄书剑;奚宁;赵迎功;戴新宇;陈家骏;;一种错误敏感的词对齐评价方法[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
10 左云存;宗成庆;;基于HMM的短语翻译对抽取方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前1条
1 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 汤小娜;词义消歧在统计机器翻译中的应用研究[D];厦门大学;2007年
2 王可为;基于统计的双语术语自动抽取[D];南京理工大学;2007年
3 曲晓航;统计与语言学相结合的词对齐及相关融合策略研究[D];哈尔滨工业大学;2008年
4 郭红梅;双语对齐技术研究[D];北京邮电大学;2006年
5 刘树杰;半指导的判别式英汉词汇对齐研究[D];哈尔滨工业大学;2007年
6 周蓝海;多策略英汉词对齐技术的研究[D];沈阳航空工业学院;2009年
7 刘建基;基于关联度和词对齐的双语组块获取研究[D];南京理工大学;2006年
8 任志敏;对齐技术的研究及其在译文自动评测中的应用[D];沈阳航空航天大学;2011年
9 米锐;火灾图像自动监测技术的研究与开发[D];四川大学;2003年
10 权毓舒;三维点云数据的预处理研究[D];西北工业大学;2005年
中国重要报纸全文数据库 前10条
1 记者 刘晖;朝华MP3寻求差异化[N];计算机世界;2003年
2 柴文;伊利寻求差异化营销[N];市场报;2003年
3 蕴涛;提高服务求差异[N];中国电脑教育报;2004年
4 王雅慧;提高服务求差异[N];中国计算机报;2004年
5 华云俊;医院营销要追求差异化[N];医药经济报;2003年
6 计世资讯(CCW Research);IA架构服务器:寻求差异化[N];计算机世界;2004年
7 唐川;寻求差异化之路[N];中国计算机报;2003年
8 唐川;追求特色 追求差异化[N];中国计算机报;2003年
9 张仲超;沪上便利业变阵[N];中国商报;2003年
10 辽宁记者 于倩;沈阳纠偏就实强力发展[N];中国房地产报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978