收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于有限资源的双语词对齐算法

张孝飞  陈肇雄  黄河燕  张亮  
【摘要】:双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及不同语言间的固有差异和翻译习惯等诸多问题。本文在词法分析的基础上,利用有限的语言资源(主要只使用了一部双语词典),采取多级匹配和消歧算法,将词对齐问题转化为迭代求解锚点词对的过程,取得了较好的效果。经过对真实语料的测试,词对齐准确率达93.0%,召回率达77.3%,F值达84.2%,基本上满足了应用的实际要求。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 本刊记者;;2003自然语言处理与知识工程国际会议将在中国北京举行[J];语言科学;2003年03期
2 秦玮远;;自然语言中副语言的逻辑处理[J];现代语文(语言研究版);2007年07期
3 陈肇雄,王英姿;我国智能型机器翻译研究获重要成果[J];中国科学基金;1997年03期
4 常宝宝;;自然语言分析与生成术语简介[J];术语标准化与信息技术;2010年04期
5 田怀凤;;基于多策略的专业术语抽取处理技术的研究[J];计算机与现代化;2008年12期
6 徐臻;;试论语言工程的开发[J];黑龙江高教研究;1984年02期
7 吕西安·马尔柰夫,保尔·若利昂;简论自然语言处理的连接网络法[J];中文信息学报;1997年02期
8 陆俭明;;要重视特征的研究与描写[J];长江学术;2006年01期
9 赵铁军;朱聪慧;;世界最大的自然语言处理和语音技术实验室——哈尔滨工业大学语言语音教育部-微软重点实验室[J];计算机教育;2007年11期
10 F·Z·;自然语言处理学术讨论会在京举行[J];语文建设;1989年04期
11 黄昌宁,周明;亚太地区自然语言处理的学术盛会——记在韩国汉城召开的NLPRS’95[J];当代语言学;1996年02期
12 魏长宏;张春柏;;机器翻译的译后编辑[J];中国科技翻译;2007年03期
13 刘海涛;冯志伟;;自然语言处理的概率配价模式理论[J];语言科学;2007年03期
14 李可胜;;语言学中的形式语义学[J];中国社会科学院研究生院学报;2009年02期
15 肖磊;;《左传》地名研究初探[J];文教资料;2009年18期
16 宗成庆;曹右琦;俞士汶;;中文信息处理60年[J];语言文字应用;2009年04期
17 祝清松;;我国自然语言处理研究的文献计量分析[J];情报杂志;2009年S2期
18 欧阳燕;;短语结构语法与范畴语法的对比分析[J];青年文学家;2011年09期
19 一石;;《面向自然语言处理的语体学理论》(霍四通著)出版[J];修辞学习;2005年06期
20 王祁;;格语法在英汉机器翻译系统中的应用研究[J];东北大学学报(社会科学版);2005年06期
中国重要会议论文全文数据库 前10条
1 张孝飞;陈肇雄;黄河燕;张亮;;基于有限资源的双语词对齐算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 陈晴;姚天顺;;基于双语句对语料库的词对齐模型[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 吕雅娟;赵铁军;李生;杨沐昀;;统计和词典方法相结合的双语语料库词对齐[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 任登君;李珩;张俐;姚天顺;;基于词对齐的双语组块对齐[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 朱丹青;常宝宝;;一种基于N-Best结果组合优选的词语对齐方法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
6 黄书剑;奚宁;赵迎功;戴新宇;陈家骏;;一种错误敏感的词对齐评价方法[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
7 华却才让;;藏汉句子局部对齐策略的研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 周国栋;李军辉;钱龙华;朱巧明;;基于结构化句法信息的自然语言处理技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 张霄军;;隐喻和换喻的计算综述[A];第四届全国认知语言学研讨会论文摘要汇编[C];2006年
中国博士学位论文全文数据库 前10条
1 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
2 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
3 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
4 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
5 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
6 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
7 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
8 段嫚娟;向心理论的参数化研究及其在汉语指代消解中的应用[D];上海外国语大学;2006年
9 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
10 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘金凤;面向自然语言处理的汉语句子语义知识库构建研究[D];鲁东大学;2009年
2 麦丽开·阿布德瓦力;面向机器翻译的汉维词语对齐规范[D];新疆大学;2012年
3 史瑞耘;论机器翻译的语义分析方法[D];哈尔滨工程大学;2004年
4 陈丽江;汉语真实文本的语义角色标注[D];南京师范大学;2007年
5 魏蓉;限定领域的基本陈述句句法分析[D];天津师范大学;2008年
6 程月;现代汉语动宾搭配多角度考察及其自动识别[D];南京师范大学;2008年
7 牧仁高娃;蒙古语语料库标注及相关对策研究[D];内蒙古大学;2008年
8 谈益峰;功能语法计算化小议[D];上海外国语大学;2009年
9 吴金星;蒙古语词法标注语料库的构建及相关技术研究[D];内蒙古大学;2011年
10 李思舒;一种多语言、多编码的识别方法[D];南京大学;2012年
中国重要报纸全文数据库 前4条
1 本报记者 塔娜;为中国少数民族语言研究提供资源平台[N];中国社会科学院院报;2007年
2 记者  潘国霖;关注社会生活 加强应用研究[N];中国教育报;2006年
3 记者 高敬云;我国少数民族语言信息化进程提速[N];中国民族报;2004年
4 冯志伟;数学是语言学现代化的重要工具[N];中国社会科学报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978