收藏本站
《第六届汉语词汇语义学研讨会论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

以词义为主轴的综合型语言知识库

俞士汶  朱学锋  段慧明  张化瑞  
【摘要】:北京大学计算语言学研究所已经积累了一系列规模大、质量上乘的语言数据资源。不过,以往这些语言数据资源彼此是独立存在的。2004年,开始把这些语言数据资源集成到一起,目标是建设综合型语言知识库。本文提出“以词义为主轴”的决策。《现代汉语语法信息词典》和基本标注语料库构成综合型语言知识库的主体部分。“以词义为主轴”集成《现代汉语语法信息词典》和基本标注语料库,就需要用“同形”信息(粗粒度的词义)填补两者之间目前存在的“缝隙”。本文还简要介绍了集成不同结构的语言数据资源的技术思路。

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 刘耀;段慧明;穗志方;;非相关文献知识发现的数据基础研究——以中医药古文献语言知识库的构建为例[J];情报杂志;2006年09期
中国重要会议论文全文数据库 前2条
1 吴云芳;温珍珊;段慧明;俞士汶;;语料库粗粒度词义标注[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 王萌;俞士汶;段慧明;孙薇薇;;基于语料统计的现代汉语量名搭配研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
【参考文献】
中国期刊全文数据库 前3条
1 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范[J];中文信息学报;2002年05期
2 俞士汶,段慧明,朱学锋,张化瑞;综合型语言知识库的建设与利用[J];中文信息学报;2004年05期
3 俞士汶,朱学锋;关于汉语信息处理的认识及其研究方略[J];语言文字应用;2002年02期
【共引文献】
中国期刊全文数据库 前10条
1 张小燕;普通话上声变调与轻声分析[J];阿坝师范高等专科学校学报;2004年02期
2 杨晓黎;;传承语素:汉语语素分析的新视角[J];安徽大学学报(哲学社会科学版);2012年02期
3 王有卫;;语素文字说质疑[J];安徽广播电视大学学报;2010年03期
4 陈维友;蔡文娟;;韵律对英语诅咒插入语和汉语离合词表达的制约作用[J];安徽电子信息职业技术学院学报;2009年03期
5 熊仲儒;;致使的语音实现及其句法蕴含[J];安徽师范大学学报(人文社会科学版);2005年06期
6 熊仲儒;;汉语中无定主语的允准条件[J];安徽师范大学学报(人文社会科学版);2008年05期
7 熊仲儒;;领属性致使句的句法分析[J];安徽师范大学学报(人文社会科学版);2012年03期
8 严芳;;浅谈对外汉语中离合词的教学[J];安徽文学(下半月);2008年04期
9 薛凤生;;动补结构否定形式小议[J];安徽文学(下半月);2008年08期
10 官杨;;程度副词修饰名词浅析[J];安徽文学(下半月);2008年12期
中国重要会议论文全文数据库 前10条
1 加米拉·吾守尔;瓦依提·阿布力孜;吐尔根·依布拉音;;《现代维吾尔语语法信息词典》数据库建设的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 徐赳赳;;现代汉语篇章中启后性分析[A];和谐社会:社会建设与改革创新——2007学术前沿论丛(下卷)[C];2007年
3 李影;付莉;;韩国中小学生“是”的错序偏误分析[A];语言与文化研究(第四辑)[C];2009年
4 郑述谱;;语言单位与词典的类型及结构[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
5 刘建梅;;关于编纂外向型汉外字典的设想[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
6 田野;;北京话强调焦点句音量分析[A];第九届中国语音学学术会议论文集[C];2010年
7 苏新春;王惠;卢伟清;秦少康;;语言知识库的内化与细化——完善词义知识库之设想[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 邹晓辉;;优化“语义信息处理”的新方法与实施例——从“一词泛读”到“释义字组”再到“一字精读”[A];第六届汉语词汇语义学研讨会论文集[C];2005年
9 林建平;;轻重与“方言语调”[A];首届全国普通话水平测试学术研讨会论文集[C];2002年
10 靳光瑾;;计算机理解汉语需要语法理论支撑[A];语言文字应用研究论文集(Ⅱ)[C];2004年
中国博士学位论文全文数据库 前10条
1 邱闯仙;现代汉语插入语研究[D];南开大学;2010年
2 吴善子;汉韩反诘语气副词对比研究[D];上海外国语大学;2010年
3 李红梅;韩国语范围表达研究[D];上海外国语大学;2010年
4 刘春兰;《训世评话》语法研究[D];南开大学;2010年
5 李秉震;汉语话题标记的语义、语用功能研究[D];南开大学;2010年
6 郭红;基于第二语言教学的汉语语气范畴若干问题研究[D];南开大学;2010年
7 刘艳红;唐五代方位词研究[D];南开大学;2010年
8 董正存;汉语全称量限表达研究[D];南开大学;2010年
9 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年
10 龙又珍;现代汉语寒暄系统研究[D];武汉大学;2009年
中国硕士学位论文全文数据库 前10条
1 赵桂阳;现代汉语“不是X的X”结构考察[D];哈尔滨师范大学;2010年
2 马晶晶;表人名词类词缀“X手”、“X者”、“X员”分析比较[D];辽宁师范大学;2010年
3 顾倩;现代汉语否定副词“不”“没(没有)”“别”的对比研究[D];辽宁师范大学;2010年
4 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
5 宗政;2009年中国政府工作报告翻译对比研究[D];上海外国语大学;2010年
6 陶胜妃;现代汉语谓词修饰词前后位置比较研究[D];上海外国语大学;2010年
7 丁熠;“契合”类语气副词研究[D];上海外国语大学;2010年
8 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
9 姜丹丹;面向对外汉语教学的插入语研究[D];辽宁师范大学;2010年
10 李艳艳;“V一把”结构研究[D];辽宁师范大学;2010年
【同被引文献】
中国重要会议论文全文数据库 前3条
1 王惠;俞士汶;詹卫东;;现代汉语语义词典(SKCC)的新进展[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 俞士汶;段慧明;朱学锋;;词语兼类暨动词向名词漂移现象的计量分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 方芳;李斌;;基于语料库的数量名短语识别[A];第三届学生计算语言学研讨会论文集[C];2006年
【二级引证文献】
中国期刊全文数据库 前3条
1 杨进;罗漫;张启蕊;;文本挖掘在中医药文献分析中的应用[J];广东药学院学报;2010年02期
2 曹志杰;冷伏海;;非相关文献知识发现方法在航天科技情报研究中的应用分析[J];情报理论与实践;2008年04期
3 钱庆;洪娜;李勇;安新颖;;中文非相关文献知识发现系统CmedLBKD构建[J];情报理论与实践;2012年04期
中国博士学位论文全文数据库 前1条
1 黄水清;非相关文献知识发现方法及在农业经济学中的应用[D];南京农业大学;2010年
中国硕士学位论文全文数据库 前1条
1 白玲玲;中医药古文献语料库建设的语料分类问题研究[D];山东中医药大学;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
中国重要会议论文全文数据库 前1条
1 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国重要报纸全文数据库 前1条
1 本报记者 温红彦;[N];人民日报;2002年
【相似文献】
中国期刊全文数据库 前10条
1 宗成庆;曹右琦;俞士汶;;中文信息处理60年[J];语言文字应用;2009年04期
2 乐明;;第21届国际计算语言学双年会暨第44届计算语言学会年会概览[J];当代语言学;2008年03期
3 黄昌宁,孙茂松;全球计算语言学的盛会COLING—ACL8简介[J];当代语言学;1999年01期
4 ;编者的话[J];中文信息学报;1992年03期
5 史有为;汉语的处理与观念的转变——计算语言学与语言学工作者[J];语文建设;1992年12期
6 ;计算语言学与语言科技原文丛书[J];中文信息学报;2010年05期
7 冯志伟;;英国的计算语言学[J];当代语言学;1988年01期
8 ;全国第八届计算语言学联合学术会议在南京召开[J];中国语文;2005年06期
9 ;首届全国计算语言学联合学术会议在杭州召开[J];语文建设;1992年02期
10 杜健;普及计算语言学知识是信息时代的迫切需要——记《计算语言学系列讲座》[J];语言文字应用;1999年02期
中国重要会议论文全文数据库 前10条
1 俞士汶;朱学锋;段慧明;张化瑞;;以词义为主轴的综合型语言知识库[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 周国栋;李军辉;钱龙华;朱巧明;;基于结构化句法信息的自然语言处理技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 张霄军;;隐喻和换喻的计算综述[A];第四届全国认知语言学研讨会论文摘要汇编[C];2006年
5 马颖华;苏贵洋;;基于概念的自然语言处理[A];第一届学生计算语言学研讨会论文集[C];2002年
6 俞士汶;王治敏;朱学锋;;文学语言与自然语言理解研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 龚彦如;李竹;冯志伟;;英——汉计算语言学术语数据库[A];语言文字应用研究论文集(Ⅰ)[C];1995年
8 龚彦如;李竹;冯志伟;;英-汉计算语言学术语数据库[A];语言文字应用研究论文集(Ⅱ)[C];2004年
9 易绵竹;薛恩奎;李绍哲;南振兴;;一种与UNL接口的机器翻译系统ETAP-3概要[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
10 张俊萍;冯志伟;;CTT在汉语语法研究和教学中的应用[A];第六届汉语词汇语义学研讨会论文集[C];2005年
中国重要报纸全文数据库 前9条
1 全国政协委员 石锐;建立健全国家民族语言数据库[N];人民政协报;2006年
2 本报记者 塔娜;为中国少数民族语言研究提供资源平台[N];中国社会科学院院报;2007年
3 记者  潘国霖;关注社会生活 加强应用研究[N];中国教育报;2006年
4 宗河;培养具有创新意识的语言学人才[N];中国教育报;2007年
5 记者 高敬云;我国少数民族语言信息化进程提速[N];中国民族报;2004年
6 王德春;世界上最大的一套语言学百科全书中国落地[N];文汇报;2008年
7 冯志伟;数学是语言学现代化的重要工具[N];中国社会科学报;2010年
8 罗骥 云南省语言学会常务副会长,云南师范大学文学与新闻传播学院教授,《云南师范大学学报》编辑部主任;中国语言学:面临的问题和发展的动力[N];中国社会科学报;2010年
9 教育部语信司;语言资源监测与服务论坛举行[N];语言文字周报;2010年
中国博士学位论文全文数据库 前10条
1 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
2 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
3 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
4 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
5 王志栋;语用要点识别模型研究[D];清华大学;2008年
6 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
7 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
8 段嫚娟;向心理论的参数化研究及其在汉语指代消解中的应用[D];上海外国语大学;2006年
9 赵春利;形名组合的静态与动态研究[D];暨南大学;2006年
10 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘金凤;面向自然语言处理的汉语句子语义知识库构建研究[D];鲁东大学;2009年
2 严峻;核查理论的计算机运用[D];南京师范大学;2004年
3 史瑞耘;论机器翻译的语义分析方法[D];哈尔滨工程大学;2004年
4 牧仁高娃;蒙古语语料库标注及相关对策研究[D];内蒙古大学;2008年
5 何晓丽;现代汉语动态助词“了”的自动生成研究[D];南京师范大学;2007年
6 何向真;多语言电子词典构建[D];西北民族大学;2010年
7 陈丽江;汉语真实文本的语义角色标注[D];南京师范大学;2007年
8 阿米娜木·买买提明;维吾尔标准书面语与口语动词变位形式的对比研究[D];新疆大学;2007年
9 董雪松;建立面向信息处理的词汇认知语义分析模型的尝试[D];黑龙江大学;2007年
10 魏蓉;限定领域的基本陈述句句法分析[D];天津师范大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026