收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种改进的增量贝叶斯分类算法

马后锋  樊兴华  
【摘要】:贝叶斯分类器在知识储备不足的情况下,容易对新增未标注的训练文本(新增训练集)产生分类错误,若这些分类错误的文本过早地加入到分类器中会降低其分类性能;另外,新增训练集的规模过大将会降低增量学习的速度。为了解决这些问题本文提出一种增量学习序列选择的新方法:首先利用当前分类器选择分类正确的文本组成新增训练子集,然后利用0-1损失率对新增训练子集进行增量实例选择。通过选择合理的学习序列强化了较完备数据对分类的积极影响,弱化了噪音数据的消极影响。对比实验结果表明,改进算法不仅提高了分类效率同时也提高了分类精度。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 周屹;;基于Naive Bayes的文本分类器的设计与实现[J];黑龙江工程学院学报;2007年02期
2 唐小力;吕宏伟;;基于SVM的文本多类分类方法研究[J];电脑知识与技术(学术交流);2006年08期
3 王彦明;奉永桃;奉国和;;1999-2008年我国SVM文本分类文献计量分析[J];图书情报工作;2009年20期
4 宫秀军,刘少辉,史忠植;一种增量贝叶斯分类模型[J];计算机学报;2002年06期
5 萧嵘,王继成,孙正兴,张福炎;一种SVM增量学习算法[J];南京大学学报(自然科学版);2002年02期
6 姜卯生,王浩,姚宏亮;朴素贝叶斯分类器增量学习序列算法研究[J];计算机工程与应用;2004年14期
7 祁瑞华;杨德礼;胡润波;;基于特征缺失补偿最大熵模型的文本分类[J];情报杂志;2010年05期
8 郑东飞;石冰;;文本分类的归纳学习算法和描述[J];计算机工程与设计;2006年04期
9 李祥纳;艾青;秦玉平;刘卫江;;支持向量机增量学习算法综述[J];渤海大学学报(自然科学版);2007年02期
10 余承依;;基于贝叶斯增量分类的邮件过滤研究[J];科学技术与工程;2009年09期
11 巩军;刘鲁;;一种k-NN文本分类器的改进方法[J];情报学报;2007年01期
12 董乐红;耿国华;周明全;;一个中文文本自动分类器的设计[J];计算机应用与软件;2008年04期
13 蒋望东;陆小艺;林士敏;;处理缺失数据的朴素贝叶斯分类增量算法[J];科学技术与工程;2008年14期
14 匡春临;夏清强;;基于SVM-KNN的文本分类算法及其分析[J];计算机时代;2010年08期
15 滕月阳,唐焕文,张海霞;一种新的支持向量机增量学习算法[J];计算机工程与应用;2004年36期
16 马忠宝;刘冠蓉;;基于支持向量机的中文文本分类模型研究[J];计算机技术与发展;2006年11期
17 李建刚;霍焱;;一种基于遗传神经网络文本分类器的研究[J];电脑知识与技术(学术交流);2007年11期
18 肖建鹏;张来顺;任星;;基于增量学习的直推式支持向量机算法[J];计算机应用;2008年07期
19 萧嵘 ,王继成 ,孙正兴 ,张福炎;一种SVM增量学习算法α-ISVM[J];软件学报;2001年12期
20 胡学钢;董学春;谢飞;;基于词向量空间模型的中文文本分类方法[J];合肥工业大学学报(自然科学版);2007年10期
中国重要会议论文全文数据库 前10条
1 马后锋;樊兴华;;一种改进的增量贝叶斯分类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
2 刘欣;章勇;王娟;;增量学习的TFIDF_NB协同训练分类算法[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
4 殷苌茗;陈焕文;谢丽娟;;基于最大期望学习算法的无标识文本分类[A];2002中国控制与决策学术年会论文集[C];2002年
5 包剑;冀明;冯军;;基于模糊支持向量机的文本分类[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
6 张长利;左万利;彭涛;赫枫龄;彭钊;邵慧勇;;基于无监督聚类的PU文本分类方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
7 陈东亮;白清源;;基于词频向量的关联文本分类[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
9 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
10 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 赵强利;基于选择性集成的在线机器学习关键技术研究[D];国防科学技术大学;2010年
2 谢元澄;分类器集成研究[D];南京理工大学;2009年
3 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
4 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
5 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年
6 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
7 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
8 陈景年;选择性贝叶斯分类算法研究[D];北京交通大学;2008年
9 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
10 杨大鹏;仿人型假手多运动模式的肌电控制研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 谭新;基于语义特征提取的PU文本分类的研究与实现[D];吉林大学;2007年
2 许晓晴;基于SVM的文本分类算法研究[D];吉林大学;2008年
3 李聪娥;局部线性嵌入在文本分类中的应用[D];河北工业大学;2007年
4 竭洋;基于模糊支持向量机的多类文本分类方法研究[D];兰州理工大学;2009年
5 程泽凯;贝叶斯网络结构学习及MBNC实验平台的构建[D];广西师范大学;2004年
6 何伟;基于张量空间模型的文本分类研究[D];合肥工业大学;2010年
7 王懿;基于自然语言处理和机器学习的文本分类及其应用研究[D];中国科学院研究生院(成都计算机应用研究所);2006年
8 杜玲;覆盖算法的增量学习研究[D];安徽大学;2010年
9 张智敏;基于增量学习的分类算法研究[D];华南理工大学;2010年
10 徐欣;基于粗糙集理论的文本分类研究[D];浙江理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978