Alteryx预测默认风险的分类模型 信誉度 步骤1:了解业务和数据 需要做出什么决定? 主要目标是预测该人值得获得信贷,根据他的历史记录,鉴于其个人特征/变量,所涉及的风险是多少。 需要哪些数据来告知这些决定? 需要历史数据(包括他的年龄/状态/以前的记录等)来预测可能的最佳结果,无论他/她是否退还贷款。 我们需要使用哪种模型(连续,二进制,非二进制,时间序列)来帮助做出这些决策? 由于我们试图预测一个人是否值得,因此它明确指出了一个二元问题,因此我们需要为此使用二元模型。 步骤2:建立训练集 对于数字数据字段,相关性至少应为0.70,才能被视为“高”。 缺少大量数据的字段应删除。