收藏本站
《黑龙江省计算机学会2007年学术交流年会论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计的命名实体翻译

王松  杨沐昀  赵铁军  
【摘要】:在人名翻译任务完成之后,地名、机构名将是名实体翻译必须解决的问题。ACE在完成名实体识别的评测任务之后,目前正在酝酿并开展名实体翻译任务的国际评测,可见该问题正在成为一个潜在的研究热点。本文应用当前主流的统计机器翻译工具pharaoh对机构名进行了几组对比翻译实验,对结果进行了详细的分析,目的是找出当前翻译方法中存在的问题,以期对齐进行改进。并且提出了基于字的翻译模型的训练方法,在此基础上进一步提出了分字和分词模型相融合的方法,使得翻译性能取得了连续提高。

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
2 刘群;统计机器翻译综述[J];中文信息学报;2003年04期
【共引文献】
中国期刊全文数据库 前10条
1 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
2 方莹,葛寒松;基于聚类的分级信息抽取方法初探[J];电脑知识与技术;2005年30期
3 赵文;唐建雄;高庆锋;;基于统计的中文网页正文抽取的研究[J];电脑知识与技术;2008年01期
4 余承健;;基于表格语义的Web信息抽取方法的研究[J];电脑知识与技术;2008年12期
5 张贯虹;高玲玲;;一种基于统计和模板的双层翻译研究[J];电脑知识与技术;2008年32期
6 胡静芳;沈亚斌;;基于Web的新闻采集系统[J];电脑知识与技术;2009年19期
7 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
8 孙娜;;基于本体的文本分类研究综述[J];电脑知识与技术;2011年10期
9 齐嘉,傅骞;Web信息抽取技术在智能WAP网关中的应用[J];电信科学;2005年07期
10 肖明;;机器翻译系统中间件模型[J];福建电脑;2006年03期
中国博士学位论文全文数据库 前10条
1 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
2 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
3 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
4 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
5 俞晓晶;基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D];中国科学院研究生院(上海生命科学研究院);2006年
6 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
7 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
8 乐小虬;非结构化网络空间信息智能搜索与服务研究[D];中国科学院研究生院(遥感应用研究所);2006年
9 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
10 王立荣;信号通路相关文献挖掘与分析方法研究[D];中国科学技术大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 王志洋;吕雅娟;刘群;;面向形态丰富语言的多粒度翻译融合[J];中文信息学报;2011年04期
2 张亚军;;汉语-维吾尔语机器翻译解码器研究[J];昌吉学院学报;2011年03期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
2 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 杜金华;王莎;;西安理工大学统计机器翻译系统技术报告(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 于惠;谢军;熊皓;吕雅娟;刘群;林守勋;;基于篇章上下文的统计机器翻译方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 梁芳丽;李淼;李文;陈雷;乌达巴拉;;统计机器翻译中的源语言重排序方法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 朱海;李淼;张建;乌达巴拉;;系统融合方法在汉蒙统计机器翻译上的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 董兴华;周俊林;郭树盛;吐尔洪·吾司曼;;基于短语的汉维(维汉)统计机器翻译研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 姚树杰;肖桐;朱靖波;;基于句对质量和覆盖度的统计机器翻译训练语料选取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 李响;徐金安;刘群;吕雅娟;姜文斌;;移动终端机器翻译设备的解码定点化方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 巢文涵;李舟军;;ZZX_MT系统CWMT2011评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国博士学位论文全文数据库 前6条
1 蒋宏飞;基于同步树替换文法的统计机器翻译方法研究[D];哈尔滨工业大学;2010年
2 段楠;统计机器翻译的一致性解码方法研究[D];天津大学;2012年
3 黄书剑;统计机器翻译中的词对齐研究[D];南京大学;2012年
4 陈毅东;基于短语的统计机器翻译模型若干关键技术研究[D];厦门大学;2008年
5 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
6 王博;机器翻译系统的自动评价及诊断方法研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 张春越;统计机器翻译中树到串对齐模板模型系统实现和比较研究[D];哈尔滨工业大学;2010年
2 李函章;统计机器翻译中语料选择方法研究[D];黑龙江大学;2010年
3 宋美娜;基于词缀特征的汉蒙统计机器翻译系统[D];内蒙古大学;2010年
4 李天宁;词对齐技术研究及统计机器翻译平台的构建[D];东北大学;2009年
5 张涛;面向特定领域的统计机器翻译研究与应用[D];昆明理工大学;2011年
6 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
7 应玉龙;汉蒙词法分析及其在统计机器翻译中的应用[D];中国科学技术大学;2010年
8 蓝翔;采用统计机器翻译模型的复述生成技术研究[D];哈尔滨工业大学;2010年
9 狄萍;基于短语的统计机器翻译的研究[D];苏州大学;2010年
10 李文;形态非对称汉蒙统计机器翻译模型构造方法研究[D];中国科学技术大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026