收藏本站
《自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

统计和词典方法相结合的双语语料库词对齐

吕雅娟  赵铁军  李生  杨沐昀  
【摘要】:双语语料库词对齐研究对于自然语言处理的许多应用具有重要意义.本文在对基于统计和基于词典的词对齐方法进行实验分析的基础上,提出了基于词典的语言学信息与词性统计相结合的词对齐方法,该方法在训练语料库规模较小的情况下,充分利用现有资源,取得了较好的词对齐结果.

知网文化
【引证文献】
中国期刊全文数据库 前3条
1 吕雅娟,李生,赵铁军;基于双语模型的汉语句法分析知识自动获取[J];计算机学报;2003年01期
2 吕学强,吴宏林,姚天顺;无双语词典的英汉词对齐[J];计算机学报;2004年08期
3 张春祥;赵铁军;李生;;基于多重线性回归模型的翻译等价对获取[J];计算机工程与应用;2006年04期
中国重要会议论文全文数据库 前1条
1 陈群秀;;计算机辅助翻译系统漫谈[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国硕士学位论文全文数据库 前3条
1 毕雪华;汉维双语语料库中句子对齐技术的研究[D];新疆大学;2006年
2 刘建基;基于关联度和词对齐的双语组块获取研究[D];南京理工大学;2006年
3 邓丹;汉英词语对齐技术研究[D];中国科学院研究生院(计算技术研究所);2004年
【参考文献】
中国期刊全文数据库 前1条
1 刘昕,周明,朱胜火,黄昌宁;基于自动抽取词汇信息的双语句子对齐[J];计算机学报;1998年S1期
【共引文献】
中国期刊全文数据库 前1条
1 林哲辉;贾剑锋;郭文;;新闻领域双语语料建设与句子对齐方法的研究[J];电脑与信息技术;2008年01期
中国重要会议论文全文数据库 前3条
1 李维刚;刘挺;王震;李生;;双语语料库段落重组对齐方法研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 杨建;杨沐昀;于浩;时晓升;;面向译文质量的EBMT系统实例库优化研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 胡海鹏;闫永明;吴宏林;张俐;刘绍明;;基于组合线索和核心扩展方阵匹配的中日句对齐[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前1条
1 姜怡;基于文本互文性分析计算的典籍翻译研究[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前8条
1 曹浩;基于机器学习的双语词汇抽取问题研究[D];南开大学;2011年
2 张春国;工艺语句汉英计算机辅助翻译系统关键技术研究[D];南京航空航天大学;2004年
3 张健;基于实例的机器翻译的泛化方法研究[D];中国科学院研究生院(计算技术研究所);2001年
4 李继锋;基于双层模板结构的机器翻译方法研究[D];中国科学院研究生院(计算技术研究所);2003年
5 热西旦;汉文—维吾尔文双语语料库构建的实验性研究[D];新疆大学;2007年
6 李映;基于实例的机器翻译关键技术的研究和实现[D];苏州大学;2008年
7 吴小川;泛化的基于实例方法的汉语维吾尔语模板库的构建[D];新疆大学;2012年
8 全丽丽;面向含有专业未登录词英汉平行语料句对齐的研究[D];哈尔滨理工大学;2012年
【同被引文献】
中国期刊全文数据库 前6条
1 毕雪华,吐尔根·依布拉音;基于限定领域的平行语料库的设计[J];电脑知识与技术;2005年26期
2 刘小虎,吴葳,李生,赵铁军,蔡萌,鞠英杰;基于词典和统计的语料库词汇级对齐算法[J];情报学报;1997年01期
3 王斌,刘群,张祥;汉英双语库自动分段对齐研究[J];软件学报;2000年11期
4 李 沐,吕学强,姚天顺;一种基于E-Chunk的机器翻译模型[J];软件学报;2002年04期
5 刘海涛;关于自然语言计算机处理的几点思考[J];术语标准化与信息技术;2001年01期
6 常宝宝;基于汉英双语语料库的翻译等价单位自动获取研究[J];术语标准化与信息技术;2002年02期
中国重要会议论文全文数据库 前7条
1 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 杨沐昀;赵铁军;于浩;;自底向上的汉语句法标注体系设计与实践[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 鲁川;;信息处理用汉语句子语序的认知研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 刘群;张彤;;汉英机器翻译扩充词典的建造[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
5 黄河燕;陈肇雄;;基于多策略的交互式智能辅助翻译平台总体设计[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
6 李维刚;刘挺;王震;李生;;双语语料库段落重组对齐方法研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 张孝飞;陈肇雄;黄河燕;张亮;;基于有限资源的双语词对齐算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国硕士学位论文全文数据库 前3条
1 祝志杰;IHSMTS中汉英双语句子对齐机制的设计与实现[D];南京理工大学;2002年
2 薛松;汉英平行语料库中名词短语对齐算法的研究[D];中国科学院研究生院(软件研究所);2003年
3 王飞;多语种双语对齐平台的设计与实现[D];南京理工大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 麦热哈巴·艾力;王志洋;吐尔根·依布拉音;;一种提高维吾尔语-汉语词语对齐的方法研究[J];小型微型计算机系统;2012年11期
中国重要会议论文全文数据库 前2条
1 田亮;黄辉;周沁;;面向短语的词语对齐方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
2 吴宏林;刘绍明;;基于二部图最大匹配的汉日词对齐[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前6条
1 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
2 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
3 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
4 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
5 薛永增;统计机器翻译若干关键技术研究[D];哈尔滨工业大学;2007年
6 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 葛运东;跨语言信息检索查询翻译技术研究[D];苏州大学;2010年
2 任志敏;对齐技术的研究及其在译文自动评测中的应用[D];沈阳航空航天大学;2011年
3 许超;汉英双语网页资源中相同事件文本对的提取[D];南京师范大学;2005年
4 毕雪华;汉维双语语料库中句子对齐技术的研究[D];新疆大学;2006年
5 牟小峰;面向英汉机器翻译的树库建设[D];北京语言大学;2007年
6 热西旦;汉文—维吾尔文双语语料库构建的实验性研究[D];新疆大学;2007年
7 牛洪梅;服务于汉维机器翻译系统的双语句子对齐的研究[D];新疆大学;2007年
8 刘划;基于知网的词对齐技术的研究[D];沈阳航空工业学院;2008年
9 周蓝海;多策略英汉词对齐技术的研究[D];沈阳航空工业学院;2009年
10 张跟兄;《蒙汉双语对齐语料库》的实验性研究与实现[D];内蒙古师范大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 本刊记者;;2003自然语言处理与知识工程国际会议将在中国北京举行[J];语言科学;2003年03期
2 秦玮远;;自然语言中副语言的逻辑处理[J];现代语文(语言研究版);2007年07期
3 陈肇雄,王英姿;我国智能型机器翻译研究获重要成果[J];中国科学基金;1997年03期
4 田怀凤;;基于多策略的专业术语抽取处理技术的研究[J];计算机与现代化;2008年12期
5 常宝宝;;自然语言分析与生成术语简介[J];术语标准化与信息技术;2010年04期
6 徐臻;;试论语言工程的开发[J];黑龙江高教研究;1984年02期
7 F·Z·;自然语言处理学术讨论会在京举行[J];语文建设;1989年04期
8 黄昌宁,周明;亚太地区自然语言处理的学术盛会——记在韩国汉城召开的NLPRS’95[J];当代语言学;1996年02期
9 吕西安·马尔柰夫,保尔·若利昂;简论自然语言处理的连接网络法[J];中文信息学报;1997年02期
10 陆俭明;;要重视特征的研究与描写[J];长江学术;2006年01期
中国重要会议论文全文数据库 前10条
1 周国栋;李军辉;钱龙华;朱巧明;;基于结构化句法信息的自然语言处理技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 张霄军;;隐喻和换喻的计算综述[A];第四届全国认知语言学研讨会论文摘要汇编[C];2006年
3 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 马颖华;苏贵洋;;基于概念的自然语言处理[A];第一届学生计算语言学研讨会论文集[C];2002年
5 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 田中康仁;;关于机器翻译系统未来的方向[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 苏新春;王惠;卢伟清;秦少康;;语言知识库的内化与细化——完善词义知识库之设想[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 俞士汶;朱学锋;段慧明;张化瑞;;以词义为主轴的综合型语言知识库[A];第六届汉语词汇语义学研讨会论文集[C];2005年
9 陈敏;;应用DCG文法分析汉语[A];语言文字应用研究论文集(Ⅰ)[C];1995年
10 吕雅娟;赵铁军;李生;杨沐昀;;统计和词典方法相结合的双语语料库词对齐[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国重要报纸全文数据库 前4条
1 本报记者 塔娜;为中国少数民族语言研究提供资源平台[N];中国社会科学院院报;2007年
2 记者 高敬云;我国少数民族语言信息化进程提速[N];中国民族报;2004年
3 记者  潘国霖;关注社会生活 加强应用研究[N];中国教育报;2006年
4 冯志伟;数学是语言学现代化的重要工具[N];中国社会科学报;2010年
中国博士学位论文全文数据库 前10条
1 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
2 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
3 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
4 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
5 段嫚娟;向心理论的参数化研究及其在汉语指代消解中的应用[D];上海外国语大学;2006年
6 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
7 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
8 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
9 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
10 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘金凤;面向自然语言处理的汉语句子语义知识库构建研究[D];鲁东大学;2009年
2 史瑞耘;论机器翻译的语义分析方法[D];哈尔滨工程大学;2004年
3 陈丽江;汉语真实文本的语义角色标注[D];南京师范大学;2007年
4 魏蓉;限定领域的基本陈述句句法分析[D];天津师范大学;2008年
5 陈振宁;现代汉语量范畴语义模型初探[D];四川师范大学;2006年
6 严峻;核查理论的计算机运用[D];南京师范大学;2004年
7 周云;汉语越南语机器翻译实验系统[D];中国人民解放军外国语学院;2006年
8 谭顺志;俄语歧义研究在机器翻译中的应用[D];四川大学;2006年
9 马芳;机器翻译系统中英语从句的识别研究[D];解放军信息工程大学;2006年
10 何晓丽;现代汉语动态助词“了”的自动生成研究[D];南京师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026