IEEE-CIS-欺诈检测 该存储库包含有关IEEE-CIS欺诈检测数据集的深入探索探索性数据分析(EDA)。竞争是一个二进制分类问题-即我们的目标变量是一个二进制属性(用户是否使点击欺诈?),我们的目标是尽可能将用户分类为“欺诈”或“非欺诈”。 您可以阅读IEEE-CIS欺诈检测页面中的完整数据集概述和数据描述。 在此存储库中,您可以访问; EDA.ipynb:包含深入分析的Jupyter笔记本 util_data_cleaning.py:包含大量数据清除功能的Python文件。 util_reporting.py:包含大量可视化和报告功能的Python文件。 util_feature_engineering.py:包含大量数据准备和整理功能的Python文件。 您可以看一下我的Kaggle内核,以了解如何简化EDA流程: