CA04 源码
CA04:集成模型 比较不同集成模型的性能。 资料总览数据集是从人口普查局获得的,其工资被分类为少于50k或大于或等于50k。 这些人是根据许多人口统计学变量进行分类的,包括年龄,资本损益,教育程度,每周工作时间,婚姻状况和关系,职业以及种族和性别。 脚步 数据质量分析 数据清理 寻找决策树分类器模型的最优值 寻找AdaBoost的最佳价值 寻找梯度Boost分类器的最优值 为XGB模型寻找最佳价值 比较表格中的效果 配套 将熊猫作为pd导入将numpy导入为np 从sklearn.impute导入SimpleImputer 导入matplotlib.pyplot作为plt 从sklearn.preprocessing导入LabelEncoder 从sklearn.tree导入DecisionTreeClassifier 从sklearn.ensemble导入RandomForestCl
文件列表
CA04-main.zip
(预估有个3文件)
CA04-main
CA04.ipynb
122KB
README.md
1KB
census_data.csv
4.24MB
暂无评论