收藏本站
《第十届全国少数民族语言文字信息处理学术研讨会论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

面向汉维机器翻译的双语对齐语料库设计与实现

吐尔根·依布拉音  阿里甫·库尔班维尼拉·木沙江  
【摘要】:本文借鉴于北京大学构建的“面向汉英机器翻译的双语语料库”的方法,制定汉维双语语料文本标注规范,并对限定领域双语句子自动对齐技术进行了初步的阐述,对建立具有统一标准和规范的句子级对齐的面向汉维机器翻译的服务的双语对齐语料库进行了初步的尝试。

【参考文献】
中国期刊全文数据库 前2条
1 杨沐昀;A Research on Bilingual Dictionary Based Sentence Alignment for Chinese English Parallel Corpus[J];High Technology Letters;2002年01期
2 吕学强,李清隐,陈文亮,姚天顺;汉英法律文献的子条级自动索引和对齐[J];中文信息学报;2002年04期
中国重要会议论文全文数据库 前2条
1 柏晓静;常宝宝;詹卫东;吴拥华;;构建大规模的汉英双语平行语料库[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
2 吴云芳;常宝宝;詹卫东;;汉英双语短语信息数据库的构建[A];第一届学生计算语言学研讨会论文集[C];2002年
【共引文献】
中国期刊全文数据库 前4条
1 吕学强,李清隐,任飞亮,姚天顺;基于统计的汉英法律文献亚句子级对齐[J];东北大学学报;2003年01期
2 毕雪华,吐尔根·依布拉音;基于限定领域的平行语料库的设计[J];电脑知识与技术;2005年26期
3 张霞;昝红英;张恩展;;汉英句子对齐长度计算方法的研究[J];计算机工程与设计;2009年18期
4 余正涛;线岩团;田维;郭剑毅;张涛;;基于语言特征与对数线性模型的纳西-英语双语词对齐(英文)[J];中国通信;2012年03期
中国重要会议论文全文数据库 前7条
1 常宝宝;肖华云;;面向语言学家和词典编纂专家的汉英双语语料库检索系统[A];2004年辞书与数字化研讨会论文集[C];2004年
2 刘非凡;赵军;徐波;;大规模非限定领域汉英双语语料库建设及句子对齐研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 颜伟;王洁;尚英;宋柔;;《中国大百科全书》人物传记知识提取加工规范[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 吐尔根.依布拉音;艾尔肯.伊米尔;阿布力米提.阿不都热依木;;基于翻译记忆库与基于规则的汉维-维汉机器辅助翻译系统方法与框架研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 彭国珍;邹纲;;基于汉英双语语料库述宾短语的自动抽取[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 毕雪华;吐尔根·依布拉音;;面向汉维机器翻译的双语对齐语料库的构建[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
7 热西旦·塔依;加米拉·吾守尔;吐尔根·依布拉音;;汉文-维吾尔文双语对齐语料库的实验性研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
中国硕士学位论文全文数据库 前4条
1 李雪峰;社保审计领域语料库构建研究[D];哈尔滨工程大学;2011年
2 刘冬明;汉英双语平行语料库中对齐方法的研究[D];山西大学;2004年
3 李继锋;基于双层模板结构的机器翻译方法研究[D];中国科学院研究生院(计算技术研究所);2003年
4 周辉;基于WEB挖掘的双语对获取技术研究[D];天津大学;2009年
【二级参考文献】
中国重要会议论文全文数据库 前2条
1 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 史晓东;;英汉机器翻译:现状和未来[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 王清;殷业;;基于Globish的旅游用英汉翻译系统的研究[J];企业科技与发展;2008年12期
2 哈里旦木·阿布都克里木;吐尔根·依布拉音;帕力旦·吐尔逊;艾山·吾买尔;阿布都热依木·热合曼;阿布都克力木·阿不力孜;;基于短语结构语法的维吾尔语规则库建设[J];现代计算机(专业版);2010年05期
3 热西旦·塔依;吐尔根·依布拉音;;汉文-维吾尔文双语语料库中基于词典译文的句子对齐方法研究[J];新疆大学学报(自然科学版);2009年03期
4 张普;关于大规模真实文本语料库的几点理论思考[J];语言文字应用;1999年01期
5 王爽;熊德兰;王晓霞;;基于实例的古文机器翻译设计与实现[J];许昌学院学报;2009年05期
6 张亮;王树梅;黄河燕;张孝飞;;面向中文问答系统的问句句法分析[J];山东大学学报(理学版);2006年03期
7 袁煜;;正则表达式在外语教学及研究中的应用[J];软件导刊;2011年01期
8 贾自艳,史忠植;基于概率统计技术和规则方法的新词发现[J];计算机工程;2004年20期
9 何婷婷;谢芳;;利用BP神经网络的中文词义消歧模型[J];华中师范大学学报(自然科学版);2005年04期
10 黄万武;孙炳文;;数据驱动语言学习—教学模式的转变[J];武汉科技学院学报;2006年11期
中国重要会议论文全文数据库 前10条
1 吐尔根·依布拉音;阿里甫·库尔班维尼拉·木沙江;;面向汉维机器翻译的双语对齐语料库设计与实现[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
2 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
3 殷业;王清;李夏;;基于Globish的受限域英汉机器翻译系统研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
4 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 董娜;林碧琴;丁丰;;机器翻译中若干问题的探讨[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
6 潘治文;李怡平;;一个基于语料库的葡中翻译系统[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
7 林哲民;;为微型语料库标记词类使用田野调查人员记录及基于转换的自动学习[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 何伟;侯敏;文采菊;;流行语时空监测模型研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 梁飞;吕洪波;姚锦峰;;舆情分析中语料库降维[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
10 许小星;亢世勇;;基于标注语料库的主谓谓语句的语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 闫宏志;全文翻译技术发展脉络[N];中国计算机报;2003年
2 克集;少数民族文字识别系统研制成功[N];中国质量报;2007年
3 吴加录 徐昕;Vista五大便民功能,利器还是噱头?[N];中国计算机报;2007年
4 通讯员庞旭民、杨伟;“强国天颐维哈柯文智能输入软件”面世[N];新疆日报(汉);2009年
5 ;轻松跨越语言障碍[N];中国电脑教育报;2004年
6 ;智能接口六大技术[N];计算机世界;2001年
7 记者 尚静;中科院新疆理化所开发出多语种软件测试平台[N];新疆科技报(汉);2009年
8 ;翻译软件编辑选择奖获奖产品展示[N];中国计算机报;2002年
9 ;中国研制出多民族文字印刷文档识别系统[N];今日信息报;2004年
10 ;翻译软件:实用翻译+语音翻译[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
2 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
3 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
4 张京楣;基于统计方法的文本风格分析研究[D];山东大学;2012年
5 余振山;自然语言文本中数字水印的设计与研究[D];中国科学技术大学;2009年
6 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
7 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
8 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
9 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
10 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年
中国硕士学位论文全文数据库 前10条
1 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
2 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
3 葛运东;跨语言信息检索查询翻译技术研究[D];苏州大学;2010年
4 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
5 程洁;语音翻译词典的设计实现与系统评估[D];哈尔滨工程大学;2004年
6 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
7 罗云飞;中文人称代词指代消解系统的研究与实现[D];山西大学;2005年
8 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
9 段恩泽;基于统计的汉语自动分词系统[D];电子科技大学;2005年
10 刘杰;基于唐诗语料词的提取与统计分析的研究[D];吉林大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026