收藏本站
《中国计算机语言学研究前沿进展(2007-2009)》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于专业领域平行语料的双语核心术语抽取研究

章成志  王惠临  
【摘要】:双语术语抽取在双语术语词典编撰、双语本体构建、机器翻译以及跨语言信息检索中具有重要的作用。其中,双语核心术语是双语术语识别和抽取的关键资源之一。本文将专业领域文档的关键词作为候选核心术语,利用中文和英文的专业领域分类语料,通过关键词抽取、术语度计算等关键技术,分别进行中文和英文的核心术语的识别。接着,以中英文专业领域平行语料为基础,通过双语对齐技术,自动生成中英文对照的双语核心术语列表。实验结果表明,每个专业领域中,前200对中英文对照核心术语的平均正确率在50%以上,个别领域正确率达80%左右。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 张永臣;孙乐;李飞;李文波;西野文人;于浩;方高林;;基于Web数据的特定领域双语词典抽取[J];中文信息学报;2006年02期
【共引文献】
中国期刊全文数据库 前3条
1 于海江;;平行语料库与双语词典编纂[J];辞书研究;2006年01期
2 许勇,荀恩东,贾爱平,宋柔;基于互连网的术语定义获取系统[J];中文信息学报;2004年04期
3 张永臣;孙乐;李飞;李文波;西野文人;于浩;方高林;;基于Web数据的特定领域双语词典抽取[J];中文信息学报;2006年02期
中国重要会议论文全文数据库 前2条
1 Goran Nenadi;Irena Spasi;Sophia Ananiadou;;Mining Biomedical Abstracts: What's in a Term?[A];Proceedings of the Conference First International Joint Conference on Natural Language Processing[C];2004年
2 Kamlesh Dutta;Nupur Prakash;Saroj Kaushik;;Hybrid Framework for Information Extraction for Geographical Terms in Hindi Language Texts[A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering[C];2005年
中国博士学位论文全文数据库 前5条
1 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
2 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
3 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
4 万江波;双语词典的翻译研究[D];上海外国语大学;2005年
5 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 许超;汉英双语网页资源中相同事件文本对的提取[D];南京师范大学;2005年
2 黄元萃;汉语基本名词短语的自动识别模型[D];大连理工大学;2001年
3 周晓梅;网络信息传播中的农业词语研究[D];山西大学;2004年
4 张永臣;基于互联网文本数据的特定领域双语词典抽取[D];中国科学院研究生院(软件研究所);2005年
5 黄黎;基于形式概念分析的搜索结果聚类研究[D];华中科技大学;2005年
6 余蕾;从大规模中文语料中获取和验证概念的研究[D];中国科学院研究生院(计算技术研究所);2006年
7 唐亚芳;汉英名实体词对齐技术的研究[D];哈尔滨工业大学;2006年
8 苏振明;非结构化文本中领域术语获取方法的研究[D];兰州大学;2007年
9 南铉国;基于语句相似度计算的主观题自动评分技术研究[D];延边大学;2007年
10 王可为;基于统计的双语术语自动抽取[D];南京理工大学;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 许勇,荀恩东,贾爱平,宋柔;基于互连网的术语定义获取系统[J];中文信息学报;2004年04期
【相似文献】
中国期刊全文数据库 前10条
1 潘虹;徐朝军;;LCS算法在术语抽取中的应用研究[J];情报学报;2010年05期
2 程斌;张水茂;;基于统计与规则的术语抽取[J];科技广场;2009年09期
3 刘俊杰;黄圆圆;任智军;崔碧莹;;基于浅层句法分析的术语抽取研究[J];微计算机信息;2010年18期
4 田怀凤;;基于多策略的专业术语抽取处理技术的研究[J];计算机与现代化;2008年12期
5 杜波,田怀凤,王立,陆汝占;基于多策略的专业领域术语抽取器的设计[J];计算机工程;2005年14期
6 梁颖红;张文静;张有承;;C值和互信息相结合的术语抽取[J];计算机应用与软件;2010年04期
7 季培培;鄢小燕;岑咏华;;面向领域中文文本信息处理的术语识别与抽取研究综述[J];图书情报工作;2010年16期
8 涂新辉;罗景;;基于相关术语群的中文查询扩展[J];计算机与数字工程;2008年01期
9 周浪;冯冲;黄河燕;;一种面向术语抽取的短语过滤技术[J];计算机工程与应用;2009年19期
10 贾美英;杨炳儒;郑德权;杨靖;;采用CRF技术的军事情报术语自动抽取研究[J];计算机工程与应用;2009年32期
中国重要会议论文全文数据库 前10条
1 章成志;王惠临;;基于专业领域平行语料的双语核心术语抽取研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 王海雄;郭剑毅;余正涛;毛存礼;张朝胜;雷春雅;;基于CRFs的中文领域术语自动抽取研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 ;Automatic Domain-specific Term Extraction System Based on Hybrid Approaches[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 邱艳霞;余正涛;张志坤;司圣涛;韩露;孟祥燕;;领域术语自动抽取方法研究[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
5 周浪;史树敏;冯冲;黄河燕;;基于FCM聚类算法的单词型术语识别方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 史东娜;王枞;李卫;;车牌识别领域的中文术语自动抽取[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
7 张勇;何婷婷;;基于质子串分解的网络新词汇自动抽取[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 肖诗斌;乔春庚;李渝勤;施水才;;基于未标注语料的领域词汇自动抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 谌贻荣;陆勤;李文捷;崔高颖;;一种基于共享后缀术语集改进中文核心领域本体构建的方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 张巍;游宏梁;张吉才;;一种基于加权投票的术语自动识别方法[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前7条
1 周浪;中文术语抽取若干问题研究[D];南京理工大学;2010年
2 李卫;领域知识的获取[D];北京邮电大学;2008年
3 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
4 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
5 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
6 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
7 钟美;基于Web的空间本体构建方法研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前10条
1 李丹;特定领域中文术语抽取[D];大连理工大学;2011年
2 赵欣;基于最大熵的中文术语抽取系统的设计与实现[D];西安电子科技大学;2012年
3 吴保珍;媒体流行语获取研究[D];华中师范大学;2009年
4 段国成;基于CCD的术语抽取研究[D];郑州大学;2007年
5 唐涛;面向特定领域的中文分词技术的研究[D];沈阳航空航天大学;2012年
6 王可为;基于统计的双语术语自动抽取[D];南京理工大学;2007年
7 史东娜;基于半监督学习的特定领域术语抽取算法的研究[D];北京邮电大学;2009年
8 刘磊;面向专利的双语术语自动抽取技术的研究[D];沈阳航空工业学院;2009年
9 桑爱菊;基于Text2Onto的中文本体学习技术研究[D];中国海洋大学;2009年
10 陈珂;构造领域本体概念关系的自动抽取[D];上海交通大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026