收藏本站
《第五届全国青年计算语言学研讨会论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于最大熵短语重排序模型的特征抽取算法改进

孙萌  姚建民  吕雅娟  刘群  姜文斌  
【摘要】:本文针对统计机器翻译中基于最大熵短语重排序模型特征抽取算法,提出一种改进算法。该算法能够抽取出更多准确的短语重排序信息,特别是逆序短语的特征信息,解决了原算法中最大熵训练时特征数据不平衡问题,即保序短语特征信息数量远超过逆序短语信息数量,提高了翻译中短语重排序的准确率。本文以NIST MT 05作为汉语到英语翻译的测试集,实验结果表明改进后的系统BLEU值比原系统提高0.65%。

【相似文献】
中国期刊全文数据库 前10条
1 罗夏峰;明曙军;刘永俊;;彩色人脸图像鉴别特征抽取综述[J];常熟理工学院学报;2011年04期
2 徐春明;;一种光滑局部敏感鉴别分析方法[J];计算机工程;2011年13期
3 黄传波;金忠;;基于视觉注意的彩色图像检索方法[J];光子学报;2011年07期
4 奉国和;郑伟;;文本分类特征降维研究综述[J];图书情报工作;2011年09期
5 陈才扣;史骏;侯钰;姜敏;;基于局部均值的广义散度差无监督鉴别分析[J];计算机工程与设计;2011年07期
6 徐廷学;董琪;张勇亮;张晓瑜;;基于遗传算法的最大熵导弹系统可靠性评估的研究[J];计算机与现代化;2011年09期
7 蔡华利;刘鲁;王理;;突发事件Web新闻多层次自动分类方法[J];北京工业大学学报;2011年06期
8 孙广路;郎非;薛一波;;基于条件随机域和语义类的中文组块分析方法[J];哈尔滨工业大学学报;2011年07期
9 陈友;程学旗;杨森;;面向网络论坛的高质量主题发现[J];软件学报;2011年08期
10 张军;;人体步态雷达信号时频分析方法研究[J];电子测量与仪器学报;2011年06期
中国重要会议论文全文数据库 前10条
1 孙萌;姚建民;吕雅娟;刘群;姜文斌;;基于最大熵短语重排序模型的特征抽取算法改进[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 王玉明;;最大熵可靠性评估方法的改进[A];中国工程物理研究院科技年报(2003)[C];2003年
3 陈宁昱;周雅倩;黄萱菁;吴立德;;利用未标注语料改进实体名识别性能[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 陈才扣;侯钰;;自适应监督鉴别投影分析[A];中国自动化学会控制理论专业委员会A卷[C];2011年
5 胡佳妮;郭军;徐蔚然;;一种基于短文本的独立语义特征抽取算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
6 邓中亮;;雕刻型面的特征抽取机制与自动辩识[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
7 罗海飞;虞立群;章志凌;邵晓敏;陈林;汪更生;陈弈秋;何伟杰;;一种改进型CHI的特征抽取方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
8 王毅;赵海涛;郝重阳;;最大熵三维图像分割算法研究[A];全国第十届信号与信息处理、第四届DSP应用技术联合学术会议论文集[C];2006年
9 周志红;周新聪;严新平;袁成清;;磨粒特征参数的评价与优化方法研究[A];2006全国摩擦学学术会议论文集(一)[C];2006年
10 王智超;季铎;蔡东风;张桂平;;文本聚类中基于知网的特征抽取方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 特约撰稿人 郑优军 甄浩;文稿输入让键盘走开[N];电脑报;2001年
2 朱冰;网络言论分析技术让机器读懂好恶[N];中国高新技术产业导报;2008年
3 贺慧宇;声发射监测把脉桥梁安全[N];中国建设报;2008年
4 本报记者 洪奇;手写笔:21世纪的主流输入技术[N];计算机世界;2001年
5 孙定;产品与服务[N];计算机世界;2001年
6 曹莉敏;谱分解解释技术[N];中国石油报;2006年
7 徐昕;正在成熟的生物识别技术[N];中国计算机报;2006年
8 罗敏;《中国C网中文信息应用网络系统》近日通过技术成果鉴定[N];中国高新技术产业导报;2001年
9 本报记者 张晶;水与细胞的关系是什么?[N];科技日报;2011年
10 周新红 田朝晖 段勇;信息融合:现代战争的重要支撑[N];解放军报;2005年
中国博士学位论文全文数据库 前10条
1 杨茂龙;相关投影分析在特征抽取中的应用研究[D];南京理工大学;2011年
2 滕海文;基于最大熵的结构两相优化设计[D];北京工业大学;2002年
3 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
4 赵才荣;基于图嵌入与视觉注意的特征抽取[D];南京理工大学;2011年
5 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
6 万鸣华;基于图嵌入的特征抽取与人脸识别研究[D];南京理工大学;2011年
7 曾雪强;偏最小二乘降维方法的研究与应用[D];上海大学;2009年
8 王正群;手写体汉字识别研究[D];南京理工大学;2001年
9 陈军;短信号分析技术及其在故障诊断中的应用[D];武汉理工大学;2003年
10 赵海涛;投影分析在人脸识别中的研究与应用[D];南京理工大学;2003年
中国硕士学位论文全文数据库 前10条
1 李林林;高炉专家系统中知识库的研究与实现[D];东北大学;2005年
2 蒋冀翔;基于非负矩阵分解的信息获取方法研究[D];东南大学;2006年
3 曹丽;基于流形的特征抽取及人脸识别研究[D];扬州大学;2009年
4 邵斌;基于多Agent的汉字签名认证研究[D];国防科学技术大学;2005年
5 樊培培;径向基神经网络及其在红外客流采集问题中的应用研究[D];河北工业大学;2007年
6 朱红;基于Rough Set的特征抽取算法的研究[D];湘潭大学;2002年
7 陈治纲;基于向量空间模型的文本分类系统研究与实现[D];天津大学;2005年
8 甘立国;中文文本分类系统的研究与实现[D];北京化工大学;2006年
9 刘宏伟;搜索引擎中中文WEB文本自动分类研究[D];暨南大学;2007年
10 张萍;基于非负矩阵分解的肿瘤DNA微阵列数据分类研究[D];曲阜师范大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026