C4.5决策树的生成算法

C4.5的生成算法

C4.5算法对ID3做了改进,使用信息增益比来选择特征

信息增益比计算公式:

gR(D,A)=g(D,A)H(D)g_R(D, A) = \frac{g(D, A)}{H(D)}

输入

训练数据集D 特征集A 阈值ϵ\epsilon

输出

决策树T

过程

过程与ID3决策树的生成算法完全相同。 除了在第3步中使用信息增益比来选择特征。

代码

Last updated

Was this helpful?