好的机器学习模型将极大地有助于准确的犯罪预测。 因此,研究人员比基本模型更频繁地选择高级模型。 为了确定高级模型是否具有显着优势,本研究着重从获取犯罪预测转变为比较这两种类型的犯罪预测模型之间的模型性能。 在这项研究中,我们旨在预测洛杉矶市的入室盗窃事件,并将仅使用前一年入室盗窃事件的基本模型与高级模型(包括线性回归和随机森林回归)进行了比较。 此外,美国社区调查数据还用于提供邻里级别的社会经济特征。 在完成对数据集进行正则化的数据预处理步骤之后,使用递归特征消除来确定两个高级模型的最终特征和参数。 最后,为了找到最佳拟合模型,使用了三个指标来评估模型性能:R平方,调整后的R平方和均方误差。