收藏本站
《全国第八届计算语言学联合学术会议(JSCL-2005)论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

中文缩略语还原技术初探

支流  朱学锋  段慧明  俞士汶  
【摘要】:缩略语是自然语言语汇的重要组成部分,是未定义词的主要来源之一,因此,缩略语研究也是自然语言处理的一个重要课题。本项研究的最终目标是探索中文缩略语(简称)的规律,包括缩略语的生成和还原,也就是缩略语的编码和解码。本文的工作旨在利用计算机自动还原中文缩略语(简称),尚处于初步探索阶段。本项研究利用北大计算语言学研究所的两大基本语言资源《现代汉语语法信息词典》和“大规模基本标注语料库”,提出了面向信息处理的中文缩略语(简称)分类框架,完成了相当数量的缩略语归类,设计和实现了一个基于模糊匹配的缩略语还原算法,从而为建立大规模缩略语(简称)数据库(主要包括缩略语及其对应的完整语汇或全称这两项)准备了条件。总结已完成工作的经验.提出了改进方法,特别是提出了建设包含缩略语相关句法、语义及其语境信息的缩略语知识库的构想。中文缩略语的研究也可为各种语言缩略语共同规律的研究提供数据基础和技术借鉴。

手机知网App
【参考文献】
中国重要会议论文全文数据库 前1条
1 鲍明凌;亢世勇;;基于数据库的现代汉语新词语缩略语的研究[A];第一届学生计算语言学研讨会论文集[C];2002年
【同被引文献】
中国重要会议论文全文数据库 前1条
1 崔世起 ;刘群 ;林守勋 ;孟遥 ;于浩 ;西野文人;;中文缩略语自动抽取初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国硕士学位论文全文数据库 前1条
1 牛晓雁;现代汉语缩略语研究及规范[D];河北师范大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 黄长伟;;自动文摘技术研究现状分析[J];中外企业家;2011年14期
2 刘一宁;;学术定义抽取研究综述[J];情报探索;2011年08期
3 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
4 史晓东;卢亚军;;央金藏文分词系统[J];中文信息学报;2011年04期
5 ;Web 2.0下一步:电脑自动剖析信息[J];黄金时代;2009年03期
6 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期
7 安见才让;;藏语句子相似度算法的研究[J];中文信息学报;2011年04期
8 刘兴林;郑启伦;马千里;;中文合成词识别及分词修正[J];计算机应用研究;2011年08期
9 王波;;基于领域语料的专业英语教学词汇建构[J];电脑知识与技术;2011年13期
10 张海军;彭成;栾静;;基于外部排序的字串左右熵快速计算方法[J];计算机工程与应用;2011年19期
中国重要会议论文全文数据库 前10条
1 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
2 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
5 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
8 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
10 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
4 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
7 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
8 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
9 ;开天辟地第一回[N];计算机世界;2002年
10 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
2 计峰;自然语言处理中序列标注模型的研究[D];复旦大学;2012年
3 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
4 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
5 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
6 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
7 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
10 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
2 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
3 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
4 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
5 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
6 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
7 崔昌利;俄语简单句述谓VP的模式化及自动识别[D];黑龙江大学;2005年
8 赵城利;基于Web的信息智能感知技术及应用[D];国防科学技术大学;2004年
9 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
10 巩晓婷;基于文本的信息隐藏技术研究[D];福州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026