数据科学组合 包含数据科学和数据分析项目的存储库。 使用Python进行机器学习 解释性数据分析,特征工程,监督机器学习(逻辑回归,决策树,随机森林)。 结果:基准是Logistic回归,并且在测试数据集上产生了0.7694的AUC。 通过利用随机森林和对参数进行超调,可以达到0.8025 AUC。 因此,超调会产生更好的性能。 技术: 监督机器学习:逻辑回归,决策树,随机森林 工具 : Python :熊猫,Numpy,Sklearn,Matplotlib,Seaborn 带有Python的多层感知器 解释性数据分析,特征工程,MLP 结果:该项目的基准为0.7694。 MLP模型优于基准,但没有击败随机森林。 技术: 神经网络 工具 : Python :熊猫,Numpy,Sklearn,Matplotlib,Seaborn,Keras 使用R对高维数据进行多元分析