收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

带标注语料库中切分变异的统计分析及思考

董宇  陈小荷  
【摘要】:本文对1998年1月《人民日报》标注语料中具有多种切分形式的词进行了统计,发现1034个单纯的切分变异。在此基础上从不同层面分析切分变异的出现规律,得出大量的切分变异出现在低频词、二字词中,且随着使用频率的增加,变异的从合度逐渐趋向于1。作者从语义、语法结构和语用的角度将切分变异划分为13类,使得切分变异在语义、语法结构和切分形式上取得了类的一致性,不仅可以解决某个词在语料中的切分变异问题,而且可以使语料中具有相同语义和语法结构类型的切分变异获得切分形式上的统一,从而基本解决带标注语料库中切分变异的问题。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 朱红;;基于语料库的汉语第一人称代词分析[J];古汉语研究;2011年01期
2 任海波;王刚;;基于语料库的现代汉语离合词形式分析[J];语言科学;2005年06期
3 崔刚,盛永梅;语料库中语料的标注[J];清华大学学报(哲学社会科学版);2000年01期
4 马永腾;;基于语料库的《红楼梦》中“V个VP”结构分析[J];现代语文(语言研究版);2007年02期
5 孙咏梅;吴松林;;旅游语料库模糊搜索翻译等效[J];科技资讯;2007年08期
6 董芳;蒙景村;罗刚;;水族水书语料库的建立原则研究[J];黔南民族师范学院学报;2007年06期
7 刘丽娜;;基于语料库的英汉谚语文化对比研究[J];科技信息;2009年17期
8 任梅梅;;基于语料库的典故词语修辞效果分析[J];当代小说(下);2010年03期
9 金稀玉;;基于语料库的中日韩同形异义语比较[J];语文学刊(外语教育与教学);2010年07期
10 董娜;;语料库与翻译教学[J];语文学刊;2011年09期
11 杨建军;;汉语古籍语料库的建立原则[J];辞书研究;2006年02期
12 何常丽;;语料库语言学研究综述[J];复旦外国语言文学论丛;2008年01期
13 何常丽;;语料库语言学研究综述[J];渤海大学学报(哲学社会科学版);2009年03期
14 王海静;;俗语语料库与语典编纂相关问题的思考[J];辞书研究;2011年04期
15 黄昌宁;关于处理大规模真实文本的谈话[J];语言文字应用;1993年02期
16 廉平生,王丽香;机器翻译系统探讨[J];科技情报开发与经济;1995年05期
17 丁信善;语料库语言学的发展及研究现状[J];当代语言学;1998年01期
18 邢红兵;现代汉语词类使用情况统计[J];浙江师大学报(社会科学版);1999年03期
19 段慧明,松井久仁於,徐国伟,胡国昕,俞士汶;大规模汉语标注语料库的制作与使用[J];语言文字应用;2000年02期
20 刘红蕾;基于语料库的双语词典编纂中的词性标注方法[J];华北工学院学报(社科版);2002年03期
中国重要会议论文全文数据库 前10条
1 董宇;陈小荷;;带标注语料库中切分变异的统计分析及思考[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王彬;王依然;文采菊;周鑫;;基于标注语料库的《新闻联播》语言特征统计分析[A];第三届学生计算语言学研讨会论文集[C];2006年
3 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 王东波;陈锋;;现代汉语“名+名+名”组合的统计分析[A];第三届学生计算语言学研讨会论文集[C];2006年
5 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年
6 宋鸿彦;刘军;姚天昉;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
7 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年
8 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
9 孙述学;;新词语语料库建设的一些构想[A];2004年辞书与数字化研讨会论文集[C];2004年
10 张建梅;赵玉荣;包晓荣;高娃;哈斯图雅;;构建“尹湛纳希辞典”的设想[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年
2 刘建鹏;语料库支撑的系统功能语法研究[D];西南大学;2012年
3 何婷婷;语料库研究[D];华中师范大学;2003年
4 李毅;基于语料库的隐喻普遍性与变异性研究[D];山东大学;2012年
5 唐斌;《人民日报》中(1987-2007)农民工的话语再现[D];上海外国语大学;2010年
6 徐欣;基于语料库的英汉小说语篇中话语标记功能研究[D];山东大学;2011年
7 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
8 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
9 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
10 付宁;语法化视角下的现代汉语单音方位词研究[D];山东大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘露露;汉语衍名的双事件隐喻分析[D];四川外语学院;2011年
2 杜雪玲;基于语料库的科技论文摘要体裁分析[D];大连理工大学;2008年
3 张艳;政治演讲中立场性状语的情态研究[D];大连海事大学;2011年
4 吕艳辉;基于语料库的现代汉语准口语计量研究[D];山东大学;2005年
5 洪丹凤;基于语料库的名转动词现象研究[D];北京交通大学;2011年
6 樊小玲;基于“时间”、“频率”概念和“新词语发现软件”的报刊新词语研究[D];华东师范大学;2005年
7 赵玉荣;《青史演义电子词典》形容词分库构建[D];内蒙古大学;2009年
8 邹清华;学术论文中第一人称代词的使用研究[D];吉林大学;2008年
9 徐芳;个性化语料库在语文教学中的应用研究[D];湖南师范大学;2008年
10 陈忠;现代汉语惯用语研究及在对外汉语教学中的应用[D];山东大学;2008年
中国重要报纸全文数据库 前10条
1 顾曰国;语料库语言学的发展[N];中国社会科学院院报;2003年
2 ;探索普通话自然连续语音之规律[N];光明日报;2001年
3 文枫;打开语言的窗口[N];中国社会科学院报;2009年
4 本报记者 王继晟 张然;流行语多少财富在流行[N];市场报;2003年
5 许钧朱玉彬;我国翻译史研究的新进展[N];中华读书报;2007年
6 周诺;让语言学“热”起来[N];中国教育报;2004年
7 国家语委副主任、教育部语信司司长 李宇明;《通用规范汉字表》的研制情况[N];语言文字周报;2009年
8 记者 宋晖;语言研究创新源于问题意识[N];中国社会科学报;2011年
9 教育部语言文字信息管理司司长李宇明;语言文字工作应当与时俱进[N];中国教育报;2001年
10 吴晶 董豆豆;“释放”部分异体字,政策体现人文关怀[N];新华每日电讯;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978