收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于N-gram的句子相似度计算技术

宋彦  张桂平  蔡东风  
【摘要】:在基于大规模双语语料库的机器翻译研究中,如何找到最有效的翻译参考一直以来都是人们的关注焦点, 其核心技术就是参考例句的相似度计算。本文提出了一种基于 HowNet 词语相似度的 N-gram 相似度计算方法,在此基础之上,参考机器翻译自动评测中 BLEU 的评价公式,进一步提出了一种新的句子相似度计算方法。该方法结合了 N-gram 和语义相似度计算,可以有效应用到基于实例的机器翻译、辅助机器翻译和交互式机器翻译中。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 荀恩东;颜伟;;基于语义网计算英语词语相似度[J];情报学报;2006年01期
2 张榕;;术语定义的聚类研究[J];中国科技术语;2011年01期
3 林贤明,李堂秋,陈毅东;句子相似度的动态规划求解及改进[J];计算机工程与应用;2004年35期
4 许雅缘;;基于WordNet的隐喻自动处理研究[J];外语电化教学;2010年06期
5 杨宪泽;;机器翻译的一些难点探讨[J];西南民族大学学报(自然科学版);2011年03期
6 王厚峰;基于实例的机器翻译——方法和问题[J];术语标准化与信息技术;2003年02期
7 陈春明;徐义峰;;一种基于语义度量的知识本体映射方法[J];商场现代化;2008年15期
8 张涛,杨尔弘;基于上下文词语同现向量的词语相似度计算[J];电脑开发与应用;2005年03期
9 薛春香;乔晓东;朱礼军;;KOS互操作中的术语映射研究综述[J];现代图书情报技术;2010年02期
10 张平;;同素同义单双音节动词的词义对应计算与分析[J];语言文字应用;2011年03期
11 王东波;;基于规则的单层单标记联合结构自动识别[J];文教资料;2008年09期
12 杨思春,周云霞;汉英EBMT中的模式构造与应用[J];计算机时代;2003年07期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前5条
1 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 余超;蔡东风;张桂平;;词汇语义相似度计算中相关技术的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
3 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 胡海鹏;闫永明;吴宏林;张俐;刘绍明;;基于组合线索和核心扩展方阵匹配的中日句对齐[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 余晓峰;刘鹏远;赵铁军;;一种基于《知网》的汉语词语词义消歧方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前3条
1 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
2 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
3 黄涛;知识服务的语义匹配机制研究[D];华中师范大学;2007年
中国硕士学位论文全文数据库 前4条
1 许雅缘;基于WordNet的英语隐喻自动处理研究[D];福建师范大学;2008年
2 周玉珊;基于向量空间模型的古汉语词汇研究[D];四川外语学院;2012年
3 包敏娜;《蒙古文印刷体扫描识别系统》(recog1.0版)自动校正算法研究[D];内蒙古大学;2007年
4 官却多杰;汉藏辅助翻译研究与实现[D];西藏大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978