收藏本站
《Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

Chinese-English Quasi-equivalent Noun Phrase:Definition and Automatic Identification

【摘要】:正After an examination of a Chinese-English bilingual corpus with 2239 sentence pairs, a new definition of Chinese noun phrase (NP), Quasi-equivalent Noun Phrase (equNP), is proposed with a goal of translation from Chinese NPs to English NPs. Firstly, all the equNPs in the corpus are tagged manually according to the definition in this paper. A set of part of speech (POS) templates for equNP is automatically acquired. Secondly, all the possible equNPs in a sentence are identified using the templates. These equNPs are the candidates for equNP identification. Finally, a classification process and a chunking process are carried out. In classification process, the correct equNPs are chosen from the candidates set using a maximum entropy classifier which combined POS, syntactic and semantic information. In chunking process, the equNPs in the sentence are finally chosen. On open test set, the precision is 83.75% and recall is 86.50%.
【基金】:2005 youth project of Asia research center, Tsinghua University
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 张卫国;三种定语、三类意义及三个槽位[J];中国人民大学学报;1996年04期
2 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
【共引文献】
中国期刊全文数据库 前10条
1 张仰森;曹元大;俞士汶;;最大熵方法中特征选择算法的改进与纠错排歧[J];北京理工大学学报;2006年01期
2 赵军,黄昌宁;结合句法组成模板识别汉语基本名词短语的概率模型[J];计算机研究与发展;1999年11期
3 李素建,刘群,白硕;统计和规则相结合的汉语组块分析[J];计算机研究与发展;2002年04期
4 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
5 冯冲;陈肇雄;黄河燕;王江伟;;最大熵模型的树-栅格最优N解码算法[J];计算机科学;2005年10期
6 刘贵全;曾宇斌;;基于最大熵模型的汉语依存分析[J];计算机工程;2006年11期
7 张晓艳;王挺;陈火旺;;基于混合统计模型的汉语命名实体识别方法[J];计算机工程与科学;2006年06期
8 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
9 牛正雨,柴佩琪;基于边界点词性特征统计的韵律短语切分[J];中文信息学报;2001年05期
10 刘冬明,赵军,杨尔弘;汉英双语语料库中名词短语的自动对应[J];中文信息学报;2003年05期
中国重要会议论文全文数据库 前10条
1 李优;;支持向量机在组块识别中的应用[A];第八届中国青年运筹信息管理学者大会论文集[C];2006年
2 张卫国;;名词短语:定语、中心语的语义类别及定中搭配[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 刘智颖;;谓词性短语向体词性短语的转换[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 陈群秀;;现代汉语名词槽关系系统中槽类型的研究和设计[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 李素建;刘群;;汉语组块的定义和获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 周强;;汉语部分分析研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 江荻;;现代藏语的句法组块与形式标记[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 彭国珍;邹纲;;基于汉英双语语料库述宾短语的自动抽取[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 达胡白乙拉;;蒙古语基本名词短语自动标注研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
2 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
3 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
4 李绍群;现代汉语“名_1+(的)+名_2”定中结构研究[D];福建师范大学;2005年
5 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
6 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
7 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
8 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
9 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
10 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前10条
1 黄元萃;汉语基本名词短语的自动识别模型[D];大连理工大学;2001年
2 刘春卉;“动+名”偏正结构形成原因的考察[D];广西师范大学;2002年
3 王虹;定语在句中移位作其他成分的情况考察[D];东北师范大学;2003年
4 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
5 杨淑芳;定语语义分析[D];首都师范大学;2003年
6 白慧;基于产品设计领域的名词短语语义分析[D];西安电子科技大学;2004年
7 耿春霞;基于机械设计领域的汉语句法分析研究[D];西安电子科技大学;2004年
8 刘冬明;汉英双语平行语料库中对齐方法的研究[D];山西大学;2004年
9 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
10 刘云中;基于隐马尔可夫模型的文本信息抽取算法研究[D];湖南大学;2004年
【二级参考文献】
中国期刊全文数据库 前4条
1 周强,孙茂松,黄昌宁;汉语句子的组块分析体系[J];计算机学报;1999年11期
2 刘芳,赵铁军,于浩,杨沐昀,方高林;基于统计的汉语组块分析[J];中文信息学报;2000年06期
3 赵军,黄昌宁;基于转换的汉语基本名词短语识别模型[J];中文信息学报;1999年02期
4 詹卫东,常宝宝,俞士汶;汉语短语结构定界歧义类型分析及分布统计[J];中文信息学报;1999年03期
【相似文献】
中国期刊全文数据库 前10条
1 施旗;容易混淆的同义词(一)[J];当代传播;1998年01期
2 施旗;容易混淆的同义词(三)[J];当代传播;1998年03期
3 冯志伟,曹右琦;评《现代汉语语法信息词典详解》[J];中文信息学报;1999年01期
4 施旗;容易混淆的同义词(六)[J];当代传播;1998年06期
5 施旗;容易混淆的同义词(九)[J];当代传播;1999年03期
6 施旗;容易混淆的同义词(四)[J];当代传播;1998年04期
7 施旗;容易混淆的同义词(七)[J];当代传播;1999年01期
8 施旗;容易混淆的同义词(八)[J];当代传播;1999年02期
9 施旗;容易混淆的同义词(二)[J];当代传播;1998年02期
10 ;魔鬼辞典[J];报林;2007年07期
中国重要会议论文全文数据库 前10条
1 程娟;许晓华;;HSK单双音同义动词研究[A];对外汉语教学的全方位探索——对外汉语研究学术讨论会论文集[C];2004年
2 刘辉修;;英语学习词典中同义词信息处理调查[A];中国辞书学会双语词典专业委员会第七届年会论文集[C];2007年
3 周可艳;宗成庆;;汉英统计翻译系统中未登录词的处理方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 ;Chinese-English Quasi-equivalent Noun Phrase:Definition and Automatic Identification[A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering[C];2005年
5 周杰;;浅谈留学生的同义词教学[A];语言与文化研究(第四辑)[C];2009年
6 张博;;对外汉语学习词典“同(近)义词”处理模式分析及建议[A];对外汉语学习词典学国际研讨会论文集[C];2005年
7 张白;;基于语料库的OUTCOME和CONSEQUENCE同义词对比研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
8 甘灿;孙星明;刘玉玲;向凌云;;一种改进的基于同义词替换的中文文本信息隐藏方法[A];第七届全国信息隐藏暨多媒体信息安全学术大会论文集[C];2007年
9 方懋;;日语同义词的产生及其分类[A];外语语言教学研究——黑龙江省外国语学会第十次学术年会论文集[C];1996年
10 涂良军;;语言调查和比较中应重视同义词的作用[A];第38届国际汉藏语会议论文提要[C];2005年
中国重要报纸全文数据库 前10条
1 罗刚;低血压并非休克同义词[N];健康报;2007年
2 本版编辑“中国儿童学习百科系列”主编 纪江红 复旦大学国际文化交流学院副教授、上海辞书学会理事,《现代汉语同义词词典》、《现代汉语反义词词典》等工具书的主编 贺国伟 《外研社·柯林斯少儿英汉汉英词典》主编 章思英;辞典主编谈辞典[N];中国图书商报;2007年
3 金冲及;传统文化和封建文化不是同义词[N];北京日报;2006年
4 周凤迟;邮票越来越难玩儿[N];中国商报;2005年
5 深圳商报记者 张清刘悠扬;人文主义是精致文化同义词[N];深圳商报;2007年
6 赵福军;Google动词化引发商标淡化危机?[N];中国知识产权报;2006年
7 笑蜀;我们需要一次美容革命[N];南方周末;2004年
8 ;工具书百问百答(四)[N];中国图书商报;2004年
9 本报记者 马海邻林环;飞龙在天本[N];解放日报;2007年
10 马琏 李包罗;SNOMED CT的构成与应用[N];计算机世界;2006年
中国博士学位论文全文数据库 前10条
1 王建莉;《尔雅》同义词考论[D];浙江大学;2005年
2 周文德;《孟子》单音节实词同义词研究[D];四川大学;2002年
3 雷莉;《国语》单音节实词同义词研究[D];四川大学;2003年
4 郭颖;《诸病源候论》词语研究[D];浙江大学;2005年
5 鲁六;《荀子》词汇研究[D];山东大学;2005年
6 李艳红;《汉书》单音节形容词同义关系研究[D];四川大学;2004年
7 金河钟;殷商金文词汇研究[D];山东大学;2008年
8 徐建民;基于术语关系的贝叶斯网络信息检索模型扩展研究[D];天津大学;2007年
9 申红义;出土楚简与传世典籍异文研究[D];四川大学;2006年
10 高肃秦;阿拉伯语语义研究[D];上海外国语大学;2008年
中国硕士学位论文全文数据库 前10条
1 孙寰;俄语同义词研究[D];黑龙江大学;2003年
2 赵垚;《国语》《国语注》同义并列复用结构研究[D];重庆师范大学;2005年
3 陈艳萍;汉英词典英语对等词辨析研究[D];广东外语外贸大学;2008年
4 韩丽;对英语专业本科生同义词学习情况的初步研究[D];上海外国语大学;2008年
5 彭龙;基于语料库的同义词与否定句联结模式研究[D];武汉大学;2005年
6 陈志国;同义词中核心词的提取[D];新疆师范大学;2006年
7 胡海燕;俄语同义现象浅析[D];吉林大学;2007年
8 王燕;新词语中的同义词语[D];辽宁师范大学;2008年
9 熊靓;王夫之《说文广义》研究[D];湖南师范大学;2009年
10 陆怀南;《论语》住所名词近义关系研究[D];广西师范大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026