收藏本站
《内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于WEB的计算机领域新术语的自动检测

刘知远  孙茂松  
【摘要】:本文主要介绍“基于 WEB 的计算机领域新术语的自动检测”算法的设计和实现。随着计算机技术的迅猛发展,英语中每天都会出现大量的该领域的新术语,如何将这些新兴术语及时发现并纳入到汉语中来,是一个迫切而非常有意义的工作。该算法正是基于这一需求而设计实现的。其核心思想是,首先通过语料库的比对,找到“自某一时间点”以来在计算机类语料库中新出现的词语,即候选新术语,它们满足新术语的第一个特征:然后通过考查候选新术语在时间上的频度曲线,找到其中被广泛地应用,而非昙花一现的词语,确定为新术语。

手机知网App
【参考文献】
中国期刊全文数据库 前5条
1 张德鑫;“水至清则无鱼”——我的新生词语规范观[J];北京大学学报(哲学社会科学版);2000年05期
2 郑家恒,李文花;基于构词法的网络新词自动识别初探[J];山西大学学报(自然科学版);2002年02期
3 刘华;;一种快速获取领域新词语的新方法[J];中文信息学报;2006年05期
4 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
5 邹纲,刘洋,刘群,孟遥,于浩,西野文人,亢世勇;面向Internet的中文新词语检测[J];中文信息学报;2004年06期
【共引文献】
中国期刊全文数据库 前10条
1 汪承萍;词汇的联想意义及其语用功能[J];安徽农业大学学报(社会科学版);2001年01期
2 谢娅莉;英语新词汇研究[J];安徽师范大学学报(人文社会科学版);2003年03期
3 卢小宁;从汉字“吃”看汉语词语的信息特征[J];北京邮电大学学报(社会科学版);2001年01期
4 陈宇涵,任汇江;现代汉语双音复合词的语义结构模式[J];山东工商学院学报;2003年04期
5 刘川民;从两种版本的比较谈《现代汉语词典》的收词[J];川北教育学院学报;2000年02期
6 杨彩梅,陈利文;英语基本词汇的掌握及阅读自动化[J];重庆大学学报(社会科学版);2000年03期
7 辜向东;词缀·大纲·教材·教法[J];重庆大学学报(社会科学版);2001年03期
8 李绍群,王进安;双音节定中式复合词的语法特点[J];湖南文理学院学报(社会科学版);2004年01期
9 陈勇;英汉空间隐喻成对词排序的标记性[J];重庆工学院学报;2004年04期
10 黄渊柏;临时语的作用、成因及其发展趋势[J];渝州大学学报(社会科学版);2002年02期
中国重要会议论文全文数据库 前10条
1 傅维贤;;对比与双语词典[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
2 袁明军;;《现代汉语词典》里的拟声词[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 张博;;对外汉语学习词典“同(近)义词”处理模式分析及建议[A];对外汉语学习词典学国际研讨会论文集[C];2005年
5 李绍林;;对外汉语教学中的同义词问题[A];第七届国际汉语教学讨论会论文选[C];2002年
6 邹纲;刘洋;刘群;孟遥;于浩;西野文人;亢世勇;;面向Internet的中文新词语检测[A];2004年辞书与数字化研讨会论文集[C];2004年
7 邓攀;刘功申;;基于标引信息的网络新概念发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
8 龚才春;贺敏;张华平;许洪波;程学旗;;大规模语料的频繁模式快速发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
9 郑家恒;李文花;;新词语自动识别方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 马玉霞;黄德根;杨元生;;一种改进的中文姓名识别方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国博士学位论文全文数据库 前10条
1 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
2 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
3 黄仲鸣;香港三及第文体的流变及其语言学研究[D];暨南大学;2001年
4 俞理明;汉语缩略研究[D];四川大学;2002年
5 姜玲;英汉隐喻句对比研究英汉隐喻句对比研究[D];河南大学;2003年
6 窦东友;管理、技术与英语教学[D];华东师范大学;2003年
7 刘晓梅;当代汉语新词语研究[D];厦门大学;2003年
8 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
9 史宝辉;汉语普通话词重音的音系学研究[D];北京语言大学;2004年
10 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
中国硕士学位论文全文数据库 前10条
1 潘景剑;具有中文人名识别功能的汉语自动分词算法研究[D];河北工业大学;2006年
2 胡业江;中文姓名自动识别技术研究[D];华侨大学;2005年
3 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
4 王业兵;从语境角度考察词义演变的规律[D];华中师范大学;2000年
5 高燕;汉语外来词的名实及其造词法与构词法[D];延边大学;2000年
6 陈丽萍;法律语汇中的两栖词语[D];山东师范大学;2000年
7 谢燕;新词及其翻译研究[D];广西大学;2001年
8 杨彩梅;语料库、格语法与英语动词教学[D];湖南大学;2001年
9 徐敏;英语中的性别岐视[D];湖南大学;2001年
10 洪显利;组块构建记忆策略训练,提高高一学生英语词汇学习质量的实验研究[D];西南师范大学;2001年
【同被引文献】
中国期刊全文数据库 前1条
1 刘华;;一种快速获取领域新词语的新方法[J];中文信息学报;2006年05期
【二级参考文献】
中国期刊全文数据库 前9条
1 张德鑫;“水至清则无鱼”——我的新生词语规范观[J];北京大学学报(哲学社会科学版);2000年05期
2 苏菲,王丹力,戴国忠;基于标记的规则统计模型与未登录词识别算法[J];计算机工程与应用;2004年15期
3 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
4 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
5 韩客松,王永成,陈桂林;无词典高频字串快速提取和统计算法研究[J];中文信息学报;2001年02期
6 金翔宇,孙正兴,张福炎;一种中文文档的非受限无词典抽词方法[J];中文信息学报;2001年06期
7 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
8 郑家恒,李文花;基于构词法的网络新词自动识别初探[J];山西大学学报(自然科学版);2002年02期
9 聂颂 ,何丕廉 ,孙越恒;统计与规则结合的一种新词识别方法[J];微型机与应用;2003年10期
中国博士学位论文全文数据库 前2条
1 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
2 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 詹卫东;;自然语言的自动分析与生成简介[J];术语标准化与信息技术;2010年04期
2 闫琪,张志伟,宁洪;用户搜索请求中限定成分的识别及提取[J];计算机工程与科学;2000年03期
3 左远清,周洞汝,王波;自然语言处理在搜索引擎信息检索中的应用[J];现代计算机;2002年07期
4 刘亚军,徐易,高莉莎;提高IQAS查询速度的一种方法[J];计算机工程与应用;2004年11期
5 杜波,田怀凤,王立,陆汝占;基于多策略的专业领域术语抽取器的设计[J];计算机工程;2005年14期
6 傅立云;刘新;;基于词典的汉语自动分词算法的改进[J];情报杂志;2006年01期
7 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
8 贾君枝;邰杨芳;;FrameNet的语义类型研究[J];情报理论与实践;2007年05期
9 张莉;刘雅举;李东明;侯晨伟;;中文问句分类系统的分析[J];科技情报开发与经济;2007年25期
10 程彩虹;王惠临;解国栋;;基于潜在语义分析的自动词法学习技术[J];情报理论与实践;2008年05期
中国重要会议论文全文数据库 前10条
1 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
2 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
4 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
8 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
10 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
4 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
7 聂长顺;近代汉字术语误植问题初探[N];光明日报;2006年
8 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
9 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
10 ;开天辟地第一回[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
2 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
3 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
4 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
5 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
6 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
7 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
10 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
2 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
3 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
4 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
5 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
6 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
7 崔昌利;俄语简单句述谓VP的模式化及自动识别[D];黑龙江大学;2005年
8 赵城利;基于Web的信息智能感知技术及应用[D];国防科学技术大学;2004年
9 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
10 巩晓婷;基于文本的信息隐藏技术研究[D];福州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026