泰坦尼克号幸存者的预测 这是机器学习竞赛的第一步。 挑战 :ship: 泰坦尼克号在1912年的首次航行中沉没,造成了一半以上的乘客生命。 给出了两个数据集,即train.csv和test.csv。 这两个数据集都包含每位登上泰坦尼克号飞船的乘客的信息,唯一的区别是train.csv告诉我们哪位乘客可以幸存,而test.csv却没有。 面临的挑战是建立一个预测模型,以预测test.csv中的哪些乘客更有可能幸存。 问题陈述 使泰坦尼克号乘客得以生存的特征(特征)。 预测模型 针对这一挑战,使用了几种分类模型来预测乘客的生存。 分数是Kaggle评估的分类准确性,其中1是最理想的分数。 下面显示了与分数排序一起使用的算法列表。 构建的“随机森林分类器”和“ MLP分类器”得分最高。 注意:笔记本电脑是在上运行的,因为的安装有些复杂。 未来扩展 这项工作的未来扩展包括在数据清理和更好的功能选择方