信用卡欺诈是金融机构的一个广泛问题,涉及使用支付卡进行的盗窃和欺诈。 在本文中,我们探索了线性和非线性统计模型以及机器学习模型在真实信用卡交易数据上的应用。 建立的模型是受监督的欺诈模型,试图识别哪些交易最有可能是欺诈性的。 我们讨论了数据探索,数据清理,变量创建,特征选择,模型算法和结果的过程。 探索和比较了五个不同的监督模型,包括逻辑回归,神经网络,随机森林,增强树和支持向量机。 增强树模型显示了针对此特定数据集的最佳欺诈检测结果(FDR = 49.83%)。 所得模型可以在信用卡欺诈检测系统中使用。 可以在相关业务领域(如保险和电信)中执行类似的模型开发过程,以避免或检测欺诈行为。