收藏本站
《2007'仪表,自动化及先进集成技术大会论文集(一)》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

一种改进的增量贝叶斯分类算法

马后锋  樊兴华  
【摘要】:贝叶斯分类器在知识储备不足的情况下,容易对新增未标注的训练文本(新增训练集)产生分类错误,若这些分类错误的文本过早地加入到分类器中会降低其分类性能;另外,新增训练集的规模过大将会降低增量学习的速度。为了解决这些问题本文提出一种增量学习序列选择的新方法:首先利用当前分类器选择分类正确的文本组成新增训练子集,然后利用0-1损失率对新增训练子集进行增量实例选择。通过选择合理的学习序列强化了较完备数据对分类的积极影响,弱化了噪音数据的消极影响。对比实验结果表明,改进算法不仅提高了分类效率同时也提高了分类精度。

【参考文献】
中国期刊全文数据库 前2条
1 宫秀军,刘少辉,史忠植;一种增量贝叶斯分类模型[J];计算机学报;2002年06期
2 樊兴华;孙茂松;;一种高性能的两类中文文本分类方法[J];计算机学报;2006年01期
【共引文献】
中国期刊全文数据库 前10条
1 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
2 赖英旭;杨震;;改进贝叶斯算法在未知恶意软件识别中的研究[J];北京工业大学学报;2011年05期
3 王利;张喜平;郭林;;增量式知识获取算法综述[J];重庆邮电大学学报(自然科学版);2007年S1期
4 赵军;胡栓柱;樊兴华;;一种新的词语相似度计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
5 曾立梅;;基于文本数据挖掘的硕士论文分类技术[J];重庆邮电大学学报(自然科学版);2010年05期
6 李宁;徐虹;;基于文本分类的语义平滑在语言模型中的应用(英文)[J];成都信息工程学院学报;2008年03期
7 杨凤霞;;基于特征选择的垃圾短信过滤研究[J];沧州师范专科学校学报;2011年03期
8 孙铁利;赵隽;杨凤芹;吴迪;;一种基于相对特征的文本分类算法[J];东北师大学报(自然科学版);2010年01期
9 李艳玲;戴冠中;覃森;;快速的文本倾向性分类方法(英文)[J];电子科技大学学报;2007年06期
10 樊兴华;王鹏;;基于两步策略的中文短文本分类研究[J];大连海事大学学报;2008年03期
中国重要会议论文全文数据库 前8条
1 舒宁;陶建斌;;面向土地利用分类的多源遥感数据混合贝叶斯网络分类器[A];全国农业遥感技术研讨会论文集[C];2009年
2 赖英旭;李征;;未知病毒检测技术的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
3 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 唐慧丰;谭松波;程学旗;;监督学习方法在语气挖掘中的应用研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 赵纪元;罗霄;;面向中图法的学术文献自动分类研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 任美睿;李建中;杨艳;;基于朴素贝叶斯方法的自动文本分类系统的实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 于海旭;王有伟;;基于高精确度的多策略本体映射[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
8 彭小明;辛阳;;基于增量贝叶斯算法的主题爬虫的设计与实现[A];第九届中国通信学会学术年会论文集[C];2012年
中国博士学位论文全文数据库 前10条
1 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
2 魏小涛;在线自适应网络异常检测系统模型与相关算法研究[D];北京交通大学;2009年
3 祁瑞华;不完整数据分类知识发现算法研究[D];大连理工大学;2011年
4 梁建宁;特征选择与图像匹配[D];复旦大学;2011年
5 杜炅;离散型随机变量的贝叶斯分类方法研究[D];北京大学;2011年
6 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
7 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
8 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
9 彭宏京;基于稀疏RAM的神经网络及其人脸识别应用研究[D];南京航空航天大学;2002年
10 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
中国硕士学位论文全文数据库 前10条
1 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
2 姜伦;模糊聚类算法及其在中文文本聚类中的研究与实现[D];哈尔滨理工大学;2010年
3 伍红亮;基于最小风险的贝叶斯邮件过滤算法研究[D];华南理工大学;2010年
4 李英伟;基于增量改进贝叶斯领域问句分类研究[D];昆明理工大学;2009年
5 李慧;基于贝叶斯分类方法的中文问句分类研究[D];石家庄铁道学院;2010年
6 施轶青;监督学习下的贝叶斯分类器研究[D];西安电子科技大学;2011年
7 黄美兰;车辆标志自动识别方法研究[D];西安电子科技大学;2011年
8 郭冯凤;基于粗糙集的SVM层次文本分类技术研究[D];西安电子科技大学;2010年
9 胡畅;用户行为分析系统设计[D];湖北工业大学;2011年
10 史晶晶;基于CRF的Web机构实体信息抽取系统[D];吉林大学;2011年
【二级参考文献】
中国期刊全文数据库 前1条
1 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期
【相似文献】
中国期刊全文数据库 前10条
1 周屹;;基于Naive Bayes的文本分类器的设计与实现[J];黑龙江工程学院学报;2007年02期
2 唐小力;吕宏伟;;基于SVM的文本多类分类方法研究[J];电脑知识与技术(学术交流);2006年08期
3 王彦明;奉永桃;奉国和;;1999-2008年我国SVM文本分类文献计量分析[J];图书情报工作;2009年20期
4 宫秀军,刘少辉,史忠植;一种增量贝叶斯分类模型[J];计算机学报;2002年06期
5 萧嵘,王继成,孙正兴,张福炎;一种SVM增量学习算法[J];南京大学学报(自然科学版);2002年02期
6 姜卯生,王浩,姚宏亮;朴素贝叶斯分类器增量学习序列算法研究[J];计算机工程与应用;2004年14期
7 祁瑞华;杨德礼;胡润波;;基于特征缺失补偿最大熵模型的文本分类[J];情报杂志;2010年05期
8 郑东飞;石冰;;文本分类的归纳学习算法和描述[J];计算机工程与设计;2006年04期
9 李祥纳;艾青;秦玉平;刘卫江;;支持向量机增量学习算法综述[J];渤海大学学报(自然科学版);2007年02期
10 余承依;;基于贝叶斯增量分类的邮件过滤研究[J];科学技术与工程;2009年09期
中国重要会议论文全文数据库 前10条
1 马后锋;樊兴华;;一种改进的增量贝叶斯分类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
2 刘欣;章勇;王娟;;增量学习的TFIDF_NB协同训练分类算法[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
4 殷苌茗;陈焕文;谢丽娟;;基于最大期望学习算法的无标识文本分类[A];2002中国控制与决策学术年会论文集[C];2002年
5 包剑;冀明;冯军;;基于模糊支持向量机的文本分类[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
6 张长利;左万利;彭涛;赫枫龄;彭钊;邵慧勇;;基于无监督聚类的PU文本分类方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
7 陈东亮;白清源;;基于词频向量的关联文本分类[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
9 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
10 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 赵强利;基于选择性集成的在线机器学习关键技术研究[D];国防科学技术大学;2010年
2 谢元澄;分类器集成研究[D];南京理工大学;2009年
3 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
4 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
5 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年
6 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
7 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
8 陈景年;选择性贝叶斯分类算法研究[D];北京交通大学;2008年
9 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
10 杨大鹏;仿人型假手多运动模式的肌电控制研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 谭新;基于语义特征提取的PU文本分类的研究与实现[D];吉林大学;2007年
2 许晓晴;基于SVM的文本分类算法研究[D];吉林大学;2008年
3 李聪娥;局部线性嵌入在文本分类中的应用[D];河北工业大学;2007年
4 竭洋;基于模糊支持向量机的多类文本分类方法研究[D];兰州理工大学;2009年
5 程泽凯;贝叶斯网络结构学习及MBNC实验平台的构建[D];广西师范大学;2004年
6 何伟;基于张量空间模型的文本分类研究[D];合肥工业大学;2010年
7 王懿;基于自然语言处理和机器学习的文本分类及其应用研究[D];中国科学院研究生院(成都计算机应用研究所);2006年
8 杜玲;覆盖算法的增量学习研究[D];安徽大学;2010年
9 张智敏;基于增量学习的分类算法研究[D];华南理工大学;2010年
10 徐欣;基于粗糙集理论的文本分类研究[D];浙江理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026