HIV回归案例研究 使用合并的艾滋病毒模型。 我们想找出哪种预测变量组合(X)为目标(Y)创造了最佳预测。 在我们的案例中,我们想将线性回归与岭回归和套索回归进行比较,以查看哪个模型返回的最低均方误差。 从最佳拟合回归中,我们将在OLS回归的帮助下选择最具影响力的功能。 1)我们接受了合并的数据框,并删除了nan值。 2)在我们的EDA期间,我们研究了特征之间的初始Pearson相关性,因为它们与我们的目标变量“ HIV患病率”(病例数/人口数)相关。 我们发现以下各列的Pearson相关性高于.25。 HIV感染,HIV感染MH_fac Med_mh_Fac。 Med_sa_fac Med SMAT _fac。 TMAT。 Plhiv。 SmATred_fac Tmat_fa bup_phys。 %msm12month%msm5ye 3)我们的下一步是将Train-Test-S