收藏本站
《自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

基于“动态流通语料库”进行“有效字符串”提取的初步研究

隋岩  张普  
【摘要】:本文提出了“有效字符串”的概念,试图找到从大规模中提取这种字符串的新方法.主要是以“流通度”理论为核心,通过对语料进行周遍切分并辅以“复合词典系统”,计算字符串的“流通度”.最终得到一个能够动态更新的词表.目前的方法还是试验性的,并且借鉴了前人丰富优秀的研究成果.

手机知网App
【参考文献】
中国期刊全文数据库 前5条
1 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
2 吴应良,韦岗,李海洲;基于字统计语言模型的汉语语音识别研究[J];计算机应用研究;2000年05期
3 应志伟,柴佩琪,陈其晖;文语转换系统中基于语料的汉语自动分词研究[J];计算机应用;2000年02期
4 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
5 韩客松,王永成,陈桂林;无词典高频字串快速提取和统计算法研究[J];中文信息学报;2001年02期
【共引文献】
中国期刊全文数据库 前10条
1 王玲娟;对外汉语语感教学探析[J];重庆交通学院学报(社会科学版);2002年01期
2 亢世勇;《现代汉语语法信息词典》的特点与不足[J];辞书研究;2001年06期
3 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报(自然科学版);1998年01期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 王秀坤,李政,简幼良,刘剑;基于Hash方法的机器翻译词典的组织与构造[J];大连理工大学学报;1996年03期
6 亢临生,张永奎;利用分词属性解决歧义切分[J];电脑开发与应用;1994年04期
7 李彦苓;;词式书写分析[J];东岳论丛;2007年03期
8 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报;2003年02期
9 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
10 吕学强,张乐,黄志丹,胡俊峰;基于散列技术的快速子串归并算法[J];复旦学报(自然科学版);2004年05期
中国重要会议论文全文数据库 前10条
1 隋岩;张普;;基于动态流通语料库的“动态词典”编纂[A];中国辞书论集2000[C];2000年
2 毛力群;;“拇指文化”演绎语言新时尚——手机短信的语体分析[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
3 史中琦;张普;;基于DCC动态流通语料库的流行语类型分析[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
4 何伟;侯敏;;利用词汇时间分布信息提取未登录词[A];第九届全国人机语音通讯学术会议论文集[C];2007年
5 邹纲;刘洋;刘群;孟遥;于浩;西野文人;亢世勇;;面向Internet的中文新词语检测[A];2004年辞书与数字化研讨会论文集[C];2004年
6 颜伟;;基于动态流通语料库的VSM新词发现策略[A];2004年辞书与数字化研讨会论文集[C];2004年
7 张普;;关于控制论与动态语言知识更新的思考[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 张普;;流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 亢世勇;常宝宝;刘海润;徐艳华;俞士汶;;全信息标注语料库的开发与应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
10 李芸;王强军;张普;;信息技术领域术语自动提取和动态更新研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
3 何婷婷;语料库研究[D];华中师范大学;2003年
4 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
5 王葆华;动词的语义及论元配置[D];复旦大学;2003年
6 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
7 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
8 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
9 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
10 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 高建忠;汉语动宾搭配的自动识别研究[D];北京语言文化大学;2000年
2 李波;一种基于统计的汉语多义词排歧方法[D];大连理工大学;2000年
3 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
4 刘贤俊;学术论文提要研究[D];华中师范大学;2001年
5 潘龙刚;语感、语言意识与语文教学论析[D];华中师范大学;2001年
6 唐志文;搜索引擎中数据对象研究[D];湖南大学;2001年
7 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
8 陆文彦;概念网的建模、实现与应用[D];中南大学;2002年
9 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
10 徐海英;现代汉语语法研究语义的转向[D];西南师范大学;2002年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨浩荣,王作英,陆大紟;语音识别HMM中引入帧间相关信息的一种参数化模型[J];电子学报;1998年10期
2 梅勇,王群生,徐秉铮;基于模糊神经网络的声母识别[J];电子与信息学报;1998年02期
3 关毅,张凯,付国宏;基于高阶N-gram的单词聚类和规则获取算法研究[J];计算机应用研究;1999年05期
4 鲁川,梁镇韩;信息处理用规则汉语[J];中文信息学报;1987年04期
5 张潮生;格语法与自然语言处理[J];中文信息学报;1988年04期
6 冯志伟;中文科技术语中的歧义结构及其判定方法[J];中文信息学报;1989年03期
7 孙茂松,黄昌宁;汉语中的兼类词、同形词类组及其处理策略[J];中文信息学报;1989年04期
8 梁南元;汉语计算机自动分词知识[J];中文信息学报;1990年02期
9 冯志伟;汉语句子描述中的复杂特征[J];中文信息学报;1990年03期
10 张潮生;语义表达的一些性质[J];中文信息学报;1991年01期
【相似文献】
中国重要会议论文全文数据库 前10条
1 隋岩;张普;;基于“动态流通语料库”进行“有效字符串”提取的初步研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 史中琦;张普;;基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 郑泽之;王强军;张普;;流通度—字词使用情况测定的新方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 张普;;流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 王强军;李芸;张普;;信息技术领域术语提取的初步研究[A];第一届学生计算语言学研讨会论文集[C];2002年
6 侯敏;;语言监测与词语的计量研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 张普;;关于大规模真实文本语料库的几点理论思考[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
8 傅德炫;李胜利;;关于通用结构自由格式数据系统FDS的设想[A];中国土木工程学会计算机应用学会第六届年会土木工程计算机应用文集[C];1995年
9 史中琦;张普;;基于DCC动态流通语料库的流行语类型分析[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
10 谢俊英;;新词语与时尚词语社会知晓度调查与分析[A];语言文字应用研究论文集(Ⅱ)[C];2004年
中国重要报纸全文数据库 前10条
1 刘雪梅;家有家法 行有行规[N];中国机电日报;2001年
2 湖北 吴学军;软硬兼施巧设计,电脑能作抢答器[N];电子报;2004年
3 本报记者 王继晟 张然;流行语多少财富在流行[N];市场报;2003年
4 徐委峰;用Excel批量计算年龄[N];电脑报;2003年
5 一丁;专家指出:黄金未来十年仍将保持上升势头[N];证券日报;2011年
6 商报记者 金朝力;网络流行词觊觎市场地位[N];北京商报;2008年
7 青年学者 羽戈;从汉字整形说到“黑社会”之名[N];东方早报;2009年
8 本报记者 杨波;网络热词,喧哗过后沉淀几许[N];新华日报;2011年
9 记者潘启雯 通讯员杨尔泓;2010年春夏季中国报纸十大流行语发布[N];中国社会科学报;2010年
10 郭笑红;福建塑料制品出口持续增长[N];中国化工报;2011年
中国博士学位论文全文数据库 前4条
1 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
2 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
3 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
4 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
中国硕士学位论文全文数据库 前10条
1 史中琦;基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析[D];北京语言大学;2005年
2 王蕾;基于动态流通语料库的信息技术领域术语通用化研究[D];北京语言文化大学;2003年
3 丁兆云;互联网多维层次式舆情指数若干计算方法的研究与实现[D];国防科学技术大学;2008年
4 吕荣兰;基于语料库的对外汉语口语话题及话题词表构建[D];暨南大学;2011年
5 秦鹏;平面媒体语言资源监测软件包开发及应用[D];北京语言大学;2007年
6 尹露;ACG时代背景下的青少年日源流行语研究[D];上海外国语大学;2012年
7 燕珊珊;新词新语研究[D];四川师范大学;2009年
8 骆彬;汉语新词语辅助识别系统的研制[D];中国社会科学院研究生院;2003年
9 曹卫明;近三十年流行语研究[D];浙江大学;2010年
10 高青;现代汉语字母词调查研究[D];中央民族大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026