收藏本站
《第二届全国学生计算语言学研讨会论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

兼类词排歧的一种方法

王洁  荀恩东  宋柔  
【摘要】:词性标注的关键是兼类词的排歧。本文探讨了一种方法来解决兼类问题,并以动词中的兼类词为切入点做了实验,即利用非兼类动词(纯动词)在大规模语料中的分布信息来判断具体上下文中出现的某个与动词有关的兼类词的词性。这种方法不需要人工标注好词性的训练语料,所需知识仅仅停留在词表一级,而且对其他存在兼类现象的语言也同样适用。实验结果证明了该方法的可行性。

【参考文献】
中国期刊全文数据库 前2条
1 黄昌宁;统计语言模型能做什么?[J];语言文字应用;2002年01期
2 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
【共引文献】
中国期刊全文数据库 前10条
1 李良炎,何中市,易勇;基于词联接的语义表示方法和知识库建设[J];重庆大学学报(自然科学版);2004年04期
2 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
3 李朝虹,陆建湖;现代汉语自动分析研究现状综述[J];广西教育学院学报;2003年01期
4 李素建,刘群,白硕;统计和规则相结合的汉语组块分析[J];计算机研究与发展;2002年04期
5 张民,李生,赵铁军;基于评价的汉语词性纯概率标注算法[J];计算机研究与发展;1998年04期
6 高升,王晓龙;语句级汉字输入系统中语义规则研究[J];计算机工程与应用;2003年04期
7 高升,徐志明;统计语言模型中词的自动聚类技术研究[J];计算机工程与应用;2003年11期
8 王朝静,郑庆华;面向答疑文本的词类标注方法的研究与实现[J];计算机工程与应用;2004年16期
9 刘壁松,李春平;一个可扩展的文本分类系统的设计与实现[J];计算机工程与应用;2004年30期
10 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
中国重要会议论文全文数据库 前8条
1 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 陈毅东;李堂秋;郑旭玲;;融合理性主义方法和经验主义方法的思路初探——汉英机器翻译系统英文生成选词模型的设计[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
5 李素建;刘群;;基于混合模型的组块分析技术[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
6 王洁;荀恩东;罗智勇;宋柔;;现代汉语多音词自动标音研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 蔡勋梁;赵军;;信息检索中基于MLS的语言模型准确性分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 张玮;孙乐;冯元勇;吕元华;;一种结合分类模型的中文输入法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
2 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
3 何婷婷;语料库研究[D];华中师范大学;2003年
4 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
5 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
6 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
7 刘启和;基于Rough集的知识发现及其在汉语处理中的应用[D];电子科技大学;2005年
8 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
9 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
10 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 孟祥超;网络资源搜集系统的设计与实现[D];吉林大学;2005年
2 王展楣;关系词“是”和“be”的伪歧义分析及判别[D];大连理工大学;2005年
3 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
4 耿长欣;网络“净化”器的设计与实现[D];山东师范大学;2003年
5 王丁;基于中文文本分类的自动诊病系统[D];哈尔滨理工大学;2003年
6 耿春霞;基于机械设计领域的汉语句法分析研究[D];西安电子科技大学;2004年
7 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
8 刘建舟;术语自动抽取系统的设计及关键技术研究[D];华中师范大学;2004年
9 梅胜;基于SVM的多层次大类别数文本分类系统(HJ-TCM)的设计与实现[D];南京理工大学;2004年
10 李海霞;基于自然语言的图像数据库检索技术研究[D];山东师范大学;2004年
【二级参考文献】
中国期刊全文数据库 前1条
1 黄昌宁;关于处理大规模真实文本的谈话[J];语言文字应用;1993年02期
【相似文献】
中国期刊全文数据库 前10条
1 温栗;;谈谈兼类词[J];学周刊;2011年06期
2 滕欣怡;;“给力”一词初探[J];语文学刊;2011年12期
3 张谊生;;表迅捷义的“X速”词族的功能、用法与发展——兼论加词的兼类性质与副词的词类归属[J];语言教学与研究;2011年04期
4 杜兆金;;多元文化对语言歧义理解及运用的影响——以新疆农业垦区为例[J];农业考古;2011年04期
5 张海学;;再探古汉语名词词类的活用[J];考试周刊;2011年48期
6 兰碧仙;;据出土文献再论先秦汉语“有_2+VP”结构中的“有_2”[J];汉字文化;2011年04期
7 张建红;;基于语料库的汉英词典词类标注个案研究[J];四川教育学院学报;2011年07期
8 徐燕;;论给力[J];湖南工业职业技术学院学报;2011年04期
9 张谊生;;从标记词“的”的隐现与位置看汉语前加词的性质[J];汉语学习;2011年04期
10 金洪臣;;论“一时”[J];牡丹江师范学院学报(哲学社会科学版);2011年04期
中国重要会议论文全文数据库 前10条
1 王洁;荀恩东;宋柔;;兼类词排歧的一种方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 陈桂成;;说“像”及“似的、一样、一般”[A];福建省辞书学会2003年会论文集[C];2003年
3 陆俭明;王黎;;句处理中排歧问题补议[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 蒲旭;王建勇;范小明;;GHOST:作者名字排歧系统[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
5 郑旭玲;李堂秋;杨晓峰;陈毅东;;基于语义规则的汉语短语结构分析排歧初探[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 张亚旭;刘友谊;舒华;王黎;;汉语句子中双音节兼类词句法分析历程初探[A];第九届全国心理学学术会议文摘选集[C];2001年
7 温锁林;;汉语词性自动标注软件兼类词鉴别规则库的设计[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
8 俞士汶;段慧明;朱学锋;;语言工程中同形及兼类词语的处理策略[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 姜自霞;陈晓;李玉梅;靳光瑾;黄昌宁;;试论区别词的词性鉴别能力[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 郭慧志;谢学敏;张普;;抽象名词和组织类名词的限定作用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前5条
1 西南大学文学院 肖梅旎;从“沛公军霸上”说起[N];学知报;2011年
2 河南平顶山市二中 李晓红;中古汉语副词“分别”的虚化[N];学知报;2010年
3 周立军 李冲;“由于”兼属介词和连词[N];语言文字周报;2010年
4 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
5 驻马店高级中学 李继新;文言文断句技巧解析[N];驻马店日报;2011年
中国博士学位论文全文数据库 前10条
1 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
2 李茹;汉语句子框架语义结构分析技术研究[D];山西大学;2012年
3 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
4 于建平;英语情态动词语义智能排歧研究[D];上海外国语大学;2011年
5 王仁强;认知视角的汉英词典词类标注实证研究[D];广东外语外贸大学;2006年
6 方向红;基于内涵逻辑的现代汉语连接词及关联句式语义研究[D];上海师范大学;2004年
7 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年
8 淑琴;蒙古文同形词知识库的构建[D];内蒙古大学;2010年
9 姚小鹏;汉语副词连接功能研究[D];上海师范大学;2011年
10 康军帅;当代汉语新词族研究[D];中央民族大学;2012年
中国硕士学位论文全文数据库 前10条
1 杜朝科;《现代汉语词典》(第5版)兼类词研究[D];河北大学;2009年
2 杨洋;《现代汉语词典》(第5版)形副兼类词研究[D];河北师范大学;2010年
3 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
4 陈蓓;现代汉语兼类词定量分析及认知解释[D];华中师范大学;2010年
5 倪新颖;联结主义下‘能’的语义排歧研究[D];燕山大学;2010年
6 裴奇;论现代汉语双音节动名兼类词的形成[D];河北大学;2009年
7 马二磊;互联网人物信息排歧技术研究[D];哈尔滨工业大学;2010年
8 许红花;HSK甲级词中的兼类词研究[D];延边大学;2004年
9 安琳;英语情态动词MUST的语义排歧研究[D];燕山大学;2010年
10 李萨日娜;《全日制民族中小学汉语课程标准(试行)》词的兼类问题考察[D];内蒙古师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026