收藏本站
收藏 | 论文排版

C4.5经典分类算法的研究与改进

陈晶晶  
【摘要】:C4.5算法属于决策树算法,分类规则以树的形式视觉化呈现。C4.5算法的最大特点即建树规则易于观察与理解,并且分类速度快,分类器准确率高。但是C4.5算法也存在一些不足,本文针对C4.5算法在大数据背景下可能导致算法复杂度过大,效率低等问题,对C4.5算法进行了改进。算法的具体改进:根据信息增益率的计算公式,利用数学的泰勒公式及麦克劳林公式的核心思想并结合等价无穷小的性质提出一种改进的C4.5算法,减少了信息增益率的计算复杂度,进而加快了C4.5算法的信息增益率的计算速率。改进的C4.5算法与传统的C4.5算法相比,在构造决策树是具有相同的准确率和更快的计算速度,并将改进后的C4.5算法应用到高校学生的成绩分析中。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 董立岩;李真;周灵艳;;特定信息增益决策森林分类器研究[J];计算机工程与应用;2010年26期
2 熊平;朱天清;顾霄;;基于信息增益比例约束的数据匿名方法及其评估机制[J];计算机应用研究;2014年03期
3 苑春燕;李爱华;;基于信息增益和相关性的贝叶斯分类算法研究[J];网络与信息;2010年02期
4 刘庆和;梁正友;;一种基于信息增益的特征优化选择方法[J];计算机工程与应用;2011年12期
5 杨敬妹;王学军;;文本分类中信息增益算法的改进[J];计算机时代;2013年09期
6 潘若愚,韩晓峰;一种基于信息增益的产品评价系统模型[J];合肥工业大学学报(自然科学版);2003年S1期
7 陶剑文;赵杰煜;姚奇富;;信息增益区分频繁模式分类方法[J];计算机工程与应用;2009年07期
8 李菲菲;周清雷;;基于信息增益的软件特征技术[J];计算机应用研究;2014年07期
9 孙超利,张继福;基于属性-值对的信息增益优化算法[J];太原科技大学学报;2005年03期
10 张红霞;;缺失值填充:基于信息增益的方法[J];计算机工程与设计;2006年24期
11 张玉芳;陈小莉;熊忠阳;;基于信息增益的特征词权重调整算法研究[J];计算机工程与应用;2007年35期
12 沈红斌;杨杰;刘小军;陈宁江;;基于模糊信息增益的图像相关性度量[J];上海交通大学学报;2006年03期
13 刘一鸣;张化祥;;引入信息增益的层次聚类算法[J];计算机工程与应用;2012年01期
14 董微;刘学;倪宏;;基于信息增益的自适应特征选择方法[J];计算机工程与设计;2014年08期
15 黄志艳;;一种基于信息增益的特征选择方法[J];山东农业大学学报(自然科学版);2013年02期
16 张文宇;张铭华;;基于面向属性泛化及信息增益的数据挖掘方法研究[J];计算机应用;2006年04期
17 吴敏烨;;基于SVM和信息增益的属性选择算法研究[J];杭州电子科技大学学报;2008年06期
18 秦相林,程显毅;基于信息增益的图像识别[J];计算机工程与应用;2005年15期
19 熊忠阳;史艳;张玉芳;;基于信息增益的自适应主题爬行策略[J];计算机应用研究;2012年02期
20 王长志;梁刚;杨进;陈文;;基于信息增益特征优化选择的恶意软件检测方法[J];计算机安全;2013年04期
中国重要会议论文全文数据库 前3条
1 刘惠;邱天爽;;基于模糊集理论和信息增益分析技术的分类算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
2 刘鹏;雷蕾;张雪凤;;缺失数据处理方法的比较研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 王孟;白清源;谢丽聪;谢伙生;张莹;;基于信息增益规则排序的关联文本分类[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
中国硕士学位论文全文数据库 前1条
1 刘一正;基于信息增益的互联网二元关系抽取[D];华东师范大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978