adClick.csv.zip 广告点击预测数据,已脱敏,包含稀疏特征数据和稠密特征数据,需要做embemding映射,再将处理后的数据合并,通过pca降维后,预测结果准确率挺高,总共1万条数据,够用了。
德国信用卡欺诈数据.zip 信用卡欺诈数据,kaggle网站下载的原始数据,可以放心使用,建议稠密数据直接进行归一化处理,稀疏数据先进性embedding处理,之后再进行合并,整体进行pca降维,最后放入算发中使用,正确率挺高的