房价EDA和预测 介绍 随附的Jupyter笔记本包含对描述住宅房屋许多方面的数据集的分析。 笔记本使用机器学习模型根据相关特征(例如整体质量,房屋面积等)预测最终房价。 问题陈述 我们可以根据相关特征预测房屋的最终价格吗? 方法 首先,我进行了探索性数据分析,以深入了解数据。 我还检查并估算出缺少的数据,并进行了特征工程。 我创建了新功能并减少了功能数量以最大程度地减少噪音。 我实现了几种机器学习算法,包括多元线性,岭和套索回归,弹性网,决策树和随机森林回归以及KNN。 我还使用了集成方法(投票回归器)来合并以前模型的结果。 结果 使用ridge回归,我得到了最好的结果,根据测试数据集,RMSE得分为0.14443。