期刊库|学位论文库|会议论文库|飞度BOOK|站内搜索注册|充值中心|购买知网卡|送卡上门|帮助中心|
全文文献: “飞度BOOK”首届期刊庙会开幕啦!
做个飞度客,万千杂志,想看就看!
《自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集》 2001年
加入收藏 获取最新

语言工程中同形及兼类词语的处理策略

俞士汶  段慧明  朱学锋  
【摘要】:中文文本中的同形词(汉字相同的不同词)和兼类词(汉字相同、意义难以区分但语法功能明显不同的词)是自动分析的难点之一.《现代汉语语法信息词典》提供了区分同形词和兼类词的线索,“人民日报标注语料库”则提供了大量实例.本文解释在这两项语言工程中关于同形词和兼类词的处理策略.
【作者单位】:北京大学计算语言学研究所 北京大学计算语言学研究所 北京大学计算语言学研究所
【关键词】:自然语言处理 语言工程 同形词 兼类词 现代汉语语法信息词典 《人民日报》标注语料库
【基金】:国家自然科学基金项目“中文信息提取技术研究”(69483003) 973项目(G1998030507-4) 北大985项目的支持
【分类号】:H085
【正文快照】:
二.引言 汉语自动分析必须克服一系列难题。中文文本中的同形词(汉字相同的不同词,如“鲜花”的“花”和“花钱”的“花”)和兼类词(汉字相同、意义难以区分但语法功能明显不同的词,如名词的“决心”和副词的“决心”)是自动分析的难点之一。从事自然语言处理研究之初,笔者己
全文下载: CAJ格式 (推荐) PDF格式
不支持迅雷等加速下载工具,请取消加速工具后下载
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式

【引证文献】
中国期刊全文数据库 前1条
1 姚小平;论汉英词典的语法信息——六部汉英词典的比较[J];外语教学与研究;2002年02期
中国重要会议论文全文数据库 前1条
1 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
【参考文献】
中国期刊全文数据库 前2条
1 俞士汶,朱学锋,段慧明;大规模现代汉语标注语料库的加工规范[J];中文信息学报;2000年06期
2 俞士汶,朱学锋,王惠;《现代汉语语法信息词典》的新进展[J];中文信息学报;2001年01期
【共引文献】
中国期刊全文数据库 前10条
1 张剑;论用HNC理论进行中文信息处理与知识处理[J];湘南学院学报;2004年06期
2 袁占亭,张爱民,张秋余;基于概念的Web信息检索[J];计算机工程与应用;2003年36期
3 李文翔,晏蒲柳,夏德麟;基于内容主题的语料库系统设计与实现[J];计算机应用研究;2004年10期
4 俞士汶,朱学锋,段慧明;大规模现代汉语标注语料库的加工规范[J];中文信息学报;2000年06期
5 俞士汶,朱学锋,王惠;《现代汉语语法信息词典》的新进展[J];中文信息学报;2001年01期
6 许嘉璐;现状和设想——试论中文信息处理与现代汉语研究[J];中文信息学报;2001年02期
7 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范(续)[J];中文信息学报;2002年06期
8 张虎,郑家恒,刘江;语料库词性标注一致性检查方法研究[J];中文信息学报;2004年05期
9 张秋余,张红,马彦宏;基于Web信息领域的知识库模型的研究与设计[J];微机发展;2003年12期
10 徐紫云;;基于语料库的中国历代文学作品选读辅助教学与科研软件[J];语文学刊;2006年14期
中国重要会议论文全文数据库 前6条
1 周静;;从三结合角度看对外汉语句式教学——以“被”字句为例[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
2 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
3 王惠;俞士汶;詹卫东;;现代汉语语义词典(SKCC)的新进展[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 杨翠兰;;基于语料统计的汉语成语语法功能研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 牛洪梅;吐尔根.伊不拉音;;维吾尔语的词性标注校对初探[A];第三届学生计算语言学研讨会论文集[C];2006年
6 张洁;孟遥;于浩;;基于分词性能的汉语语料库比较研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 WANG Jiayue;[D];广东外语外贸大学;2003年
2 何婷婷;语料库研究[D];华中师范大学;2003年
3 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
4 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
5 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
6 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
7 刘根辉;计算语用学基础理论及其应用研究[D];华中科技大学;2005年
8 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
9 李培峰;基于语义的多文种信息处理平台SMIPP的研究[D];苏州大学;2006年
10 宗成庆;音字转换与句子规范化处理研究[D];中国科学院研究生院(计算技术研究所);1998年
中国硕士学位论文全文数据库 前10条
1 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
2 蔡丽;海外华语教材词汇分析研究[D];暨南大学;2002年
3 张爱民;自然语言处理及其智能搜索引擎模型的设计研究[D];兰州理工大学;2003年
4 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
5 吴福英;面向用户的信息过滤研究与实现[D];江西师范大学;2004年
6 曾锦麒;语义WEB的知识表示语言及其应用研究[D];中南大学;2004年
7 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
8 吕艳辉;基于语料库的现代汉语准口语计量研究[D];山东大学;2005年
9 李春明;基于全文检索的自动答疑系统的研究与设计[D];苏州大学;2005年
10 封鹏程;现代汉语法律语料库的建立及其词汇计量研究[D];南京师范大学;2005年
【同被引文献】
中国期刊全文数据库 前9条
1 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
2 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
3 俞士汶;中文输入中语法分析技术的应用[J];中文信息学报;1988年03期
4 俞士汶,朱学锋,段慧明;大规模现代汉语标注语料库的加工规范[J];中文信息学报;2000年06期
5 俞士汶,朱学锋,王惠;《现代汉语语法信息词典》的新进展[J];中文信息学报;2001年01期
6 刘岩斌,俞士汶,孙钦善;古诗研究的计算机支持环境的实现[J];中文信息学报;1997年01期
7 穗志方,俞士汶,罗凤珠;宋代名家诗自动注音研究及系统实现[J];中文信息学报;1998年02期
8 俞士汶,朱学锋,李峰;现代汉语语素库的开发及应用[J];世界汉语教学;1999年02期
9 俞士汶,段慧明,朱学锋;汉语词的概率语法属性描述[J];语言文字应用;2001年03期
【二级引证文献】
中国期刊全文数据库 前6条
1 段奡卉;从使用者的角度谈汉英词典的编纂——兼评《汉英大辞典》[J];外语研究;2002年06期
2 杨晓军,李赛红;语料库在词典编撰中的优势——兼评《牛津高阶英语学习词典》(第6版)[J];外语与外语教学;2003年04期
3 王仁强;章宜华;;汉英词典词类标注对译义准确性的影响调查[J];现代外语;2006年02期
4 俞士汶,段慧明,朱学锋,张化瑞;综合型语言知识库的建设与利用[J];中文信息学报;2004年05期
5 俞士汶,朱学锋;关于汉语信息处理的认识及其研究方略[J];语言文字应用;2002年02期
6 陈玉忠,李保利,俞士汶,兰措吉;基于格助词和接续特征的藏文自动分词方案[J];语言文字应用;2003年01期
中国重要会议论文全文数据库 前2条
1 王亚军;;从《汉英词典》、《汉英大辞典》和《新时代汉英大词典》看我国汉英双语词典的发展趋势[A];福建省外国语文学会2004年会论文集[C];2004年
2 陈玉忠;李保利;俞士汶;兰措吉;;基于格助词和接续特征的藏文自动分词方案[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前2条
1 王仁强;认知视角的汉英词典词类标注实证研究[D];广东外语外贸大学;2006年
2 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
中国硕士学位论文全文数据库 前2条
1 樊立三;现代汉语语文辞书词性标注研究[D];鲁东大学;2006年
2 胡剑亚;认知视角的汉英语文词典词类标注研究[D];厦门大学;2007年
【二级参考文献】
中国期刊全文数据库 前2条
1 朱学锋,俞士汶,王惠;现代汉语五万词语归类的实践[J];语言文字应用;1997年04期
2 俞士汶,朱学锋,李峰;现代汉语语素库的开发及应用[J];世界汉语教学;1999年02期
【相似文献】
中国期刊全文数据库 前10条
1 郭清津;中学语文文言文活用词及其他[J];齐齐哈尔大学学报(哲学社会科学版);1980年01期
2 姚汉铭;试探复合动词转化成名词的界限[J];河南大学学报(社会科学版);1980年05期
3 宋玉柱;评“名词的形谓化用法”说[J];汉语学习;1981年04期
4 谢天蔚;社会语言学[J];外语学刊;1981年03期
5 郭清津;怎样辨识古代汉语活用词[J];齐齐哈尔大学学报(哲学社会科学版);1981年Z1期
6 龚继华;谈谈动词和形容词的重叠[J];天津师范大学学报(社会科学版);1981年01期
7 陆丙甫;;动词名词兼类问题——也谈汉语词典标注词性[J];辞书研究;1981年01期
8 张本立;古汉语副词位移问题[J];中州学刊;1982年05期
9 林立;;名词动词兼类和词典标注词性问题[J];辞书研究;1982年01期
10 张伯龄;;文言实词活用的教学中值得注意的几个问题[J];西南师范大学学报(人文社会科学版);1982年04期
中国重要会议论文全文数据库 前10条
1 张亚旭;刘友谊;舒华;王黎;;汉语句子中双音节兼类词句法分析历程初探[A];第九届全国心理学学术会议文摘选集[C];2001年
2 俞士汶;段慧明;朱学锋;;语言工程中同形及兼类词语的处理策略[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 毕玉德;;韩国语句法语义信息词典的C语言描述及其计算机实现[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
4 陈桂成;;说“像”及“似的、一样、一般”[A];福建省辞书学会2003年会论文集[C];2003年
5 方向红;宋春阳;;介连兼类词“以”的句法语义区别特征及消歧策略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 尹一瓴;陈群秀;;现代汉语述语形容词机器词典的研究与实现[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 张亚旭;刘友谊;舒华;孙茂松;;汉语名动兼类词的句法分析:来自人类阅读实验的证据[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
8 王惠;李康年;;大型语义词典的计算机辅助开发与管理[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
9 王洁;荀恩东;宋柔;;兼类词排歧的一种方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前6条
1 本报记者 刘亚东;无线因特网:亚洲因特网产业革命的重心[N];科技日报;2000年
2 王佳欣;“双语大使”签售双语宝典[N];中国新闻出版报;2003年
3 编译 凌丹;未来十年 汉语能与英语抗衡吗[N];北京科技报;2004年
4 记者 杲文川;关注语音学研究成果 促进语音科学和语言工程建设[N];中国社会科学院院报;2004年
5 记者 潘国霖;教育教材语言使用将受监测[N];中国教育报;2005年
6 教育部语信司;国家语言资源监测与研究中心、中国文字整理研究和字体设计中心授牌仪式在京举行[N];语言文字周报;2005年
中国博士学位论文全文数据库 前4条
1 方向红;基于内涵逻辑的现代汉语连接词及关联句式语义研究[D];上海师范大学;2004年
2 兰庆国;可执行元模型关键技术研究[D];吉林大学;2006年
3 王仁强;认知视角的汉英词典词类标注实证研究[D];广东外语外贸大学;2006年
4 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 DAO THI HA NINH(陶氏河宁);对N/NP+L中L的考察[D];北京语言文化大学;2000年
2 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
3 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
4 陈玉洁;固化结构“差不多”的多角度考察[D];湖南师范大学;2004年
5 孙欣;明代四大传奇量词研究[D];广西师范大学;2004年
6 许红花;HSK甲级词中的兼类词研究[D];延边大学;2004年
7 陈嘉嘉;“应该”的多视角研究[D];湖南师范大学;2006年
8 杨军玲;汉语动词词语搭配自动获取方法研究[D];山西大学;2006年
9 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
10 张俊;《孟子》《韩非子》三类词句法功能的多样化和复杂化研究[D];西南大学;2006年
关于知网|版权声明|学术会议服务|广告服务|在线咨询
京ICP证040431号互联网出版许可证新出网证(京)字008号北京市公安局海淀分局备案号:110 1081725
订购咨询热线:800-810-6613、010-62985026免费送卡上门
主办:清华大学
数字出版:中国学术期刊电子杂志社
在线发行:同方知网(北京)技术有限公司
关 闭
关 闭
关 闭