收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语文本按语体分类的研究

王慧玲  宋柔  戴伟长  
【摘要】:有导文本分类是指在给定的分类体系下,通过对训练语料的学习对每个类建立特征向量以表示该类,然后对每一个新的文本自动确定其类别的过程.本文介绍的文本分类的目的不是按专业领域对文本分类,而是按语体对文本分类.这种分类研究对于统计语言模型的训练具有重要意义.本文以汉字的字频向量作为语体类别的表示方法,通过计算类别向量与文本向量的相似度来确定文本的类别.已应用该方法对几种不同语体的小说分类,取得了较好的分类结果.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王维成;现代汉语语体的分类问题[J];华南师范大学学报(社会科学版);1987年04期
2 邓志勇;“偏离说”质疑[J];修辞学习;1996年05期
3 霍四通;语体和功能——语体研究方法论探讨之三[J];修辞学习;1997年03期
4 郭杏芳;语体与文体的关系类比[J];黄冈职业技术学院学报;2000年02期
5 张德丽;政论语体的修辞特征[J];岭南学刊;2001年01期
6 许钟宁;论语体的交叉渗透[J];西北第二民族学院学报(哲学社会科学版);2002年01期
7 张拱贵,孙余兵;语体语言研究的创新与超越──喜读《语体语言教程》[J];南京师大学报(社会科学版);1994年03期
8 程祥徽;传统与现代联姻——文体与语体之辨[J];烟台大学学报(哲学社会科学版);1999年02期
9 丁金国;再论对外汉语教学中的语体意识[J];语言文字应用;1999年02期
10 杨达英;政论语体的语言持点[J];江苏大学学报(高教研究版);1984年01期
11 良止;“语体与文体学术研讨会”在澳门举行[J];修辞学习;1999年06期
12 陈凤荣;语体与外语教学[J];沈阳教育学院学报;2003年04期
13 黄岳洲,陈本源;运用语体知识进行精诚指导─—语文教学现代化杂谈[J];语言文字应用;1996年02期
14 张嘉玉;论汉语一般词汇的语体功能[J];语文学刊;2003年06期
15 霍四通;语体:能力平面的现象[J];修辞学习;2003年02期
16 赵静;语体的系统整合——以古代判词为基本依据[J];修辞学习;2003年03期
17 丁金国;言语行为与语用类型[J];语文研究;2004年04期
18 李泉;面向对外汉语教学的语体研究的范围和内容[J];汉语学习;2004年01期
19 黎平;;《南齐书》中对称代词的语体层次[J];遵义师范学院学报;2005年06期
20 张先亮;郑娟曼;;汉语“有”字句的语体分布及语用功能[J];修辞学习;2006年01期
中国重要会议论文全文数据库 前10条
1 王慧玲;宋柔;戴伟长;;汉语文本按语体分类的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 庞剑锋;程学旗;;反馈方法在文本分类系统中的应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 刘华;周凌燕;张普;;面向词典编撰的词汇聚类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 刘华;张普;;面向词典编纂的词汇聚类研究[A];2004年辞书与数字化研讨会论文集[C];2004年
6 李华;;得体性·语体·真善美[A];得体修辞学研究[C];1999年
7 李名方;;语体浅释[A];跨世纪的中国修辞学[C];1999年
8 陈浩;何婷婷;代玲;;基于向量空间模型的无导词义消歧[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 郑荣馨;;论功能域的概念[A];修辞学新视野——汉语修辞与汉文化学术研讨会论文集[C];2004年
10 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 赵娟廷;汉韩公文语体对比研究[D];复旦大学;2003年
2 郭圣林;现代汉语若干句式的语篇考察[D];复旦大学;2004年
3 潘世松;不同年龄段语用主体语体特征研究[D];复旦大学;2003年
4 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
5 翁玉莲;报刊新闻评论话语的功能语法分析[D];福建师范大学;2007年
6 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
7 肖任飞;现代汉语因果复句优先序列研究[D];华中师范大学;2009年
8 廖艳君;新闻报道的语言学研究:消息语篇的衔接和连贯[D];湖南师范大学;2004年
9 王海峰;现代汉语离合词离析形式功能研究[D];北京语言大学;2008年
10 蔡玮;新闻类语篇研究的语体学意义[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 周玉珊;基于向量空间模型的古汉语词汇研究[D];四川外语学院;2012年
2 郑梦娟;ABB式形容词研究[D];武汉大学;2004年
3 王健;语体与文体关系的一致性研究[D];云南师范大学;2002年
4 刘玉;政论语体常用词的统计研究[D];云南师范大学;2004年
5 李艳;互动与选择——语境与语体关系论[D];云南师范大学;2000年
6 陆华强;以关联理论为基础分析隐含[D];大连海事大学;2003年
7 王崇;改革开放以来汉语新生语体研究[D];黑龙江大学;2003年
8 王华梅;网络语言的语体归属[D];西南大学;2006年
9 汤蕾;现代公文语体修辞研究[D];广西民族大学;2007年
10 高明扬;科学语体与艺术语体的差异性研究[D];云南师范大学;2000年
中国重要报纸全文数据库 前10条
1 张莉;网络带来语体变化[N];北京科技报;2001年
2 本报记者 李红艳;网络泛滥“蜜糖体” 甜到腻人[N];北京日报;2010年
3 游汝杰;略谈普通话和方言的社会功能与和谐发展[N];语言文字周报;2006年
4 居延安宋怀强 吴洪林;跨语沟通:一个极具现实意义的跨世纪话题[N];文汇报;2007年
5 ;报刊语言的规范化[N];中国文化报;2003年
6 慕军 首都师范大学;治文摘通病应从题目下手[N];中国社会科学报;2010年
7 本报实习生 陈仕艳;网络语言:创新还是颠覆[N];工人日报;2007年
8 武穴市实验中学 陈水明 徐顺昌;文章修改刍议[N];黄冈日报;2009年
9 刘媛嫒 曾毅平;多学科交融中的修辞学[N];社会科学报;2009年
10 省校院校报编辑部 赵转超;消息写作中常有的缺点与应下的功夫[N];山西党校报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978