文章目录数据选取和数据情况利用C4.5算法分类离散化连续变量C4.5原理C4.5实现应用训练好的决策树分类 数据选取和数据情况 本次实验选取鸢尾花数据集(http://archive.ics.uci.edu/ml/datasets/Iris) 数据包含5列,分别是花萼长度、花萼宽度、花瓣长度、花瓣宽度、鸢尾花种类。 鸢尾花属种类包含三种:iris-setosa, iris-versicolour, iris-virginica。 每一类分别是50条,共150条数据;每一类在四个属性的分布情况如下图所示 可视化代码 import pandas as pd import matplotlib.