收藏本站
《第四届全国学生计算语言学研讨会会议论文集》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于组合线索和核心扩展方阵匹配的中日句对齐

胡海鹏  闫永明  吴宏林  张俐  刘绍明  
【摘要】:该文提出了一种基于组合线索和核心扩展方阵匹配的中日句对齐算法。该方法利用字典、字形、长度和特殊字符相结合的组合线索来计算句子相似度,并利用核心扩展方阵匹配实现中日句对齐。该方法在一定程度上解决了传统的基于长度的方法的错误蔓延问题,而且充分挖掘了中日双语之间潜在的联系,增强了相似度计算的可信度。实验表明,在中日句对齐任务中该方法取得了比较满意的结果。
【作者单位】:东北大学自然语言处理实验室 日本富士施乐公司
【分类号】:H085

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 刘昕,周明,朱胜火,黄昌宁;基于自动抽取词汇信息的双语句子对齐[J];计算机学报;1998年S1期
2 张艳,柏冈秀纪;基于长度的扩展方法的汉英句子对齐[J];中文信息学报;2005年05期
3 吕学强,李清隐,黄志丹,沈嫣娜,姚天顺;基于统计的汉英句子对齐研究[J];小型微型计算机系统;2004年06期
【共引文献】
中国期刊全文数据库 前2条
1 张霞;昝红英;张恩展;;汉英句子对齐长度计算方法的研究[J];计算机工程与设计;2009年18期
2 孙鸿仁;杨坚定;;“中国法律法规汉英平行语料库(PCCLD)”创建的思路、过程与功能[J];绍兴文理学院学报(哲学社会科学);2010年02期
中国重要会议论文全文数据库 前3条
1 吕雅娟;赵铁军;李生;杨沐昀;;统计和词典方法相结合的双语语料库词对齐[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 李维刚;刘挺;王震;李生;;双语语料库段落重组对齐方法研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 杨建;杨沐昀;于浩;时晓升;;面向译文质量的EBMT系统实例库优化研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前2条
1 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
2 姜怡;基于文本互文性分析计算的典籍翻译研究[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 王莹;从互联网上挖掘双语语料的研究与实现[D];华东师范大学;2011年
2 曹浩;基于机器学习的双语词汇抽取问题研究[D];南开大学;2011年
3 傅丽芸;中美灾害新闻报道观念与表现手法比较[D];华中科技大学;2010年
4 张春国;工艺语句汉英计算机辅助翻译系统关键技术研究[D];南京航空航天大学;2004年
5 王飞;多语种双语对齐平台的设计与实现[D];南京理工大学;2004年
6 毕雪华;汉维双语语料库中句子对齐技术的研究[D];新疆大学;2006年
7 张健;基于实例的机器翻译的泛化方法研究[D];中国科学院研究生院(计算技术研究所);2001年
8 李继锋;基于双层模板结构的机器翻译方法研究[D];中国科学院研究生院(计算技术研究所);2003年
9 热西旦;汉文—维吾尔文双语语料库构建的实验性研究[D];新疆大学;2007年
10 牛洪梅;服务于汉维机器翻译系统的双语句子对齐的研究[D];新疆大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 彭述初;;机器翻译学科发展综述[J];华中科技大学学报(社会科学版);2006年02期
2 魏任;;布拉格国际数理语言学和机器翻译座谈会[J];当代语言学;1965年06期
3 王宗炎;;日本机器翻译研究近况[J];当代语言学;1984年01期
4 黄宁夏;英汉机译系统语言比较功能处理水平分析[J];漳州师范学院学报(哲学社会科学版);2004年01期
5 鲁孝贤;;机器翻译语义排歧的方法[J];中国科技翻译;2007年04期
6 潘娣;;机器翻译的利弊以及发展前景[J];安徽文学(下半月);2008年09期
7 靜善;“语言学译叢”杂志1959年第2期机器翻译问题专号[J];外语教学与研究;1959年03期
8 刘荣;;构建大规模的汉英双语平行语料库[J];太原科技;2006年10期
9 何正国;;AntConc在机器翻译的译前处理中的应用[J];经济研究导刊;2011年15期
10 冯梅;;英汉机器翻译中的常见错误及分析[J];高校社科信息;2001年06期
中国重要会议论文全文数据库 前10条
1 胡海鹏;闫永明;吴宏林;张俐;刘绍明;;基于组合线索和核心扩展方阵匹配的中日句对齐[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 姚天顺;杨莹;;关于机器翻译的评测问题[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 柏晓静;常宝宝;詹卫东;吴拥华;;构建大规模的汉英双语平行语料库[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
4 董振东;董强;;机译研究中的一些误区——从译文质量分析看[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 刘倬;;机器翻译的发展和突破[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
6 朱平;;面向用户的机器翻译组件化设计规范[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
7 何站涛;韩兆强;闫栗丽;;机器翻译质量的研究与探讨[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 那顺乌日图;刘群;巴达玛敖德斯尔;;面向机器翻译的蒙古语生成[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 李颖;池毓焕;;汉英机器翻译中要素句蜕变换初探[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
10 段绮丽;段之宓;;机器翻译中自然语言的梯级表示模型[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
中国重要报纸全文数据库 前6条
1 何艳霞;韩国完善专利信息系统机器翻译和英文检索功能[N];中国知识产权报;2007年
2 钟华;我国人机双向协同翻译实现新突破[N];科技日报;2008年
3 邢晔;有了谷歌“统计式翻译”,翻译人员会不会下岗?[N];新华每日电讯;2007年
4 本报记者 贾婧;语音翻译:在第一时间读懂你[N];科技日报;2007年
5 王宁;翻译中的文化和文化研究中的翻译学转向[N];中华读书报;2003年
6 冯志伟;数学是语言学现代化的重要工具[N];中国社会科学报;2010年
中国博士学位论文全文数据库 前5条
1 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
2 雒自清;语义块类型、构成及变换的分析与处理[D];中国科学院研究生院(声学研究所);2004年
3 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
4 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
5 黄淑美;动宾结构汉英机器翻译研究[D];华中师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 王内;文学材料和非文学材料机器翻译适用性比较研究[D];湖南师范大学;2012年
2 麦丽开·阿布德瓦力;面向机器翻译的汉维词语对齐规范[D];新疆大学;2012年
3 李彧;构建集成系统:基于规则与统计数据的机器翻译[D];广东商学院;2012年
4 王蕾;机器翻译研究的历史和现状分析[D];湖北工业大学;2013年
5 王艳;基于功能语言学理论的机器翻译质量评估[D];中国海洋大学;2009年
6 杨万鹏;论数字化翻译标准[D];武汉理工大学;2005年
7 李宏毅;机器翻译中英译汉长句分析研究[D];河北大学;2010年
8 程霞;面向科技文献的机器翻译[D];太原理工大学;2006年
9 冯雅;现代汉语双宾动词研究[D];鲁东大学;2007年
10 林海梅;机器翻译与人类介入[D];福建师范大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026