C4.5经典分类算法的研究与改进
【摘要】:C4.5算法属于决策树算法,分类规则以树的形式视觉化呈现。C4.5算法的最大特点即建树规则易于观察与理解,并且分类速度快,分类器准确率高。但是C4.5算法也存在一些不足,本文针对C4.5算法在大数据背景下可能导致算法复杂度过大,效率低等问题,对C4.5算法进行了改进。算法的具体改进:根据信息增益率的计算公式,利用数学的泰勒公式及麦克劳林公式的核心思想并结合等价无穷小的性质提出一种改进的C4.5算法,减少了信息增益率的计算复杂度,进而加快了C4.5算法的信息增益率的计算速率。改进的C4.5算法与传统的C4.5算法相比,在构造决策树是具有相同的准确率和更快的计算速度,并将改进后的C4.5算法应用到高校学生的成绩分析中。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||
|
|
|||
|