大数据程序 使用Spark MLlib和ML库以及R编程语言的大数据程序 R编程 回归:我们考虑了特征/预测变量仅线性出现在模型中的情况。 对于Credit数据集,与常规线性模型相比,岭回归和套索仅做了很小的改进。 我们可以添加到模型中的最简单的非线性类型是特征的成对相互作用。 如果xj和xk是不同的特征,则意味着我们也将xjxk视为特征。 在R中,成对交互非常容易实现:X = model.matrix(balance〜。*。,Credit)[,-1](1)成为新的设计矩阵。 那个工程 。 ∗。 意味着考虑不同特征的所有成对乘法。 广义加性模型:我们查看了Credit数据集,将注意力集中在收