使用XGBoost和随机森林进行泰坦尼克号生还者预测实例

enlist95766 6 0 zip 2023-03-10 21:03:58

import pandas as pd

# 读取训练集数据
train = pd.read_csv('train.csv')
target = train['Survived']
data = train.loc[:, ['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare']]
data['Sex'] = data['Sex'].apply(lambda x: 1 if x == 'male' else 0)
data['Age'].fillna(data['Age'].mean(), inplace=True)

# 读取测试集数据
test = pd.read_csv('test.csv')
data_test = test.loc[:, ['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare']]
data_test['Sex'] = data_test['Sex'].apply(lambda x: 1 if x == 'male' else 0)
data_test['Age'].fillna(data_test['Age'].mean(), inplace=True)

# 数据处理
data1 = pd.get_dummies(data['Pclass'], prefix='Pclass')
data2 = pd.get_dummies(data_test['Pclass'], prefix='Pclass')
data = pd.concat([data, data1], axis=1)
data_test = pd.concat([data_test, data2], axis=1)
data.drop('Pclass', axis=1, inplace=True)
data_test.drop('Pclass', axis=1, inplace=True)

# 使用XGBoost模型进行预测
from xgboost import XGBClassifier
model = XGBClassifier()
model.fit(data, target)
result = model.predict(data_test)

# 输出预测结果
result_df = pd.DataFrame({'PassengerId':test['PassengerId'], 'Survived':result})
result_df.to_csv('result.csv', index=False)

推荐下载

泰坦尼克号准确率0.81实验报告.docx

泰坦尼克号的沉没是历史上最臭名昭著的沉船事件之一。1912年4月15日,泰坦尼克号在处女航中与冰山相撞,2224名乘客和船员中有1502人丧生。这场轰动性的悲剧震惊了国际社会,并导致了更好的船舶安全规

Dnn_pytorch_titanic kaggle的泰坦尼克号比赛源码

Dnn_pytorch_titanic KaggleのtitanicコンペをPytorchを使用し,DNNで予测を行いました。公式ページ起动方法公式ページでtitanicコンペに参加そこで,笔

kaggle titanic Kaggle的泰坦尼克号机器学习竞赛源码

卡格勒泰坦尼克号 Kaggle的《泰坦尼克号》机器学习竞赛

泰坦尼克号0.81准确率python源代码.py

这是kaggle泰坦尼克号准确率0.81的python数据分析超级详细的源代码这是传说中的泰坦尼克机器学习比赛-对你来说最好的,第一次挑战,让你潜入机器学习比赛,熟悉Kaggle平台的工作原理。竞

titanic.csv泰坦尼克号获救数据两个

titanic.csv以及titanic_train.csv泰坦尼克号获救数据两个,两个文件,特征不太一样

kaggle titanic关于Kaggle比赛的泰坦尼克号任务源码

kaggle-titanic:关于Kaggle比赛的泰坦尼克号任务

Keras预测泰坦尼克号旅客生存浙江大学城市学院.zip

深度学习应用与开发,GoogleTensorFlow-Keras预测泰坦尼克号旅客生存(浙江大学城市学院计算机与计算机科学学院)

python学习泰坦尼克号数据文件

泰坦尼克号统计资源一共三个文件,学习python很好的模拟数据,

泰坦尼克号数据用于机器学习.rar

泰坦尼克号生存者预测数据,用于机器学习各方面,数据预测,建模等等,生存与否与性别,年龄,阶层等因素是有关系的,如果把这些因素作为特征,生存的结果作为预测目标,就可以建立一个典型的二分类机器学习模型。在

泰坦尼克号数据挖掘-checkpoint.ipynb

泰坦尼克号数据挖掘-checkpoint.ipynb是一份引人入胜的文件,其中包含了对泰坦尼克号数据的深度挖掘。通过分析乘客的生存率、年龄分布、舱位等关键信息,这个文件揭示了泰坦尼克号沉船事件背后隐藏

用户评论

请输入评论内容

评分：

暂无评论