收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文文本分类系统的设计与实现

王俊英  郭景峰  霍峥  
【摘要】:文章介绍了中文文本分类系统的基本过程及其关键技术,比较和分析Rocchio、朴素贝叶斯(NB)、kNN三种文本分类算法的分类原理,提出了中文文本分类系统的结构模型,并给出了评估方法和实验结果,测试结果表明 KNN算法的分类效果最佳。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵博;丁华福;;一种基于关键向量的文本分类模型[J];信息技术;2007年12期
2 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期
3 张东礼,汪东升,郑纬民;基于VSM的中文文本分类系统的设计与实现[J];清华大学学报(自然科学版);2003年09期
4 方兰,王明文;文本自动分类技术及其应用[J];计算机与现代化;2004年07期
5 符发;;中文文本分类中特征选择方法的比较[J];现代计算机(专业版);2008年06期
6 邹加棋;陈国龙;郭文忠;;基于图模型的中文文档分类研究[J];小型微型计算机系统;2006年04期
7 张永奎;李红娟;;基于类别关键词的突发事件新闻文本分类方法[J];计算机应用;2008年S1期
8 陈芨熙;顾新建;陈国海;魏江;;基于向量空间模型和专利文献特征的相似专利确定方法[J];浙江大学学报(工学版);2009年10期
9 杨丽华;戴齐;郭艳军;;KNN文本分类算法研究[J];微计算机信息;2006年21期
10 周文霞;;现代文本分类技术研究[J];武警学院学报;2007年12期
11 贝雨馨,崔荣一;文本分类中特征项权重的计算方法[J];延边大学学报(自然科学版);2004年03期
12 胡恬;王敬;;中文文本分类技术的研究[J];科技咨询导报;2006年09期
13 肖红;刘淑华;;一种文本多级分类方法研究[J];长江大学学报(自然科学版)理工卷;2008年02期
14 马甲林;张桂珠;刘金岭;;中英文文本分类系统异同因素的探讨[J];电脑学习;2011年02期
15 卢炎生;崔得暄;邹磊;;特征序列分析方法在文本分类中的应用[J];计算机工程;2006年20期
16 解本政;;TCBPL:一种高效文本分类新方法[J];计算机工程;2005年23期
17 何国辉;吴礼发;;基于机器学习的文本分类技术的研究[J];计算机与现代化;2009年08期
18 倪茂树;时达明;林鸿飞;;基于粗糙集属性约简的文本分类[J];郑州大学学报(理学版);2007年02期
19 台德艺;谢飞;胡学钢;;基于位置权重的文本分类[J];安徽水利水电职业技术学院学报;2008年01期
20 黄浩;王英林;;面向企业应用的文本自动分类系统的设计和实现[J];计算机应用与软件;2007年11期
中国重要会议论文全文数据库 前10条
1 王俊英;郭景峰;霍峥;;中文文本分类系统的设计与实现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
2 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
4 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
6 朱琳;周水庚;;基于聚类的文本分类属性加权[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
7 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
9 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
10 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
3 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
4 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
5 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
6 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
7 郝立柱;汉语文本自动分类[D];吉林大学;2008年
8 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
9 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
10 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
中国硕士学位论文全文数据库 前10条
1 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
2 马宏伟;基于SVM的中文文本分类系统的建模与实现[D];大连理工大学;2006年
3 甘立国;中文文本分类系统的研究与实现[D];北京化工大学;2006年
4 王小燕;文本分类相关技术与应用研究[D];西北大学;2007年
5 孙岩国;基于Internet的中文文本过滤系统的研究与实践[D];兰州理工大学;2004年
6 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
7 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
8 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
9 赵博;一种基于关键向量的文本分类模型的研究[D];哈尔滨理工大学;2008年
10 闫晨;KNN文本分类研究[D];燕山大学;2010年
中国重要报纸全文数据库 前9条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 记者 徐瑞哲;29家沪籍软件企业加入“国家队”[N];解放日报;2009年
3 希安;微软试水信息检索[N];经济日报;2004年
4 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
5 方安全;解决Flash课件中显示乱码的问题[N];中国电脑教育报;2003年
6 冯晓娜;中英文混合输入[N];中国电脑教育报;2004年
7 乐乐2004;英语成语速查手册[N];中国电脑教育报;2004年
8 国寿股份北京研发中心 陈起;确定软件质量目标 提高开发效率[N];中国保险报;2009年
9 畅想;CIO如何利用及经营好信息系统[N];中国冶金报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978