颜色分类leetcode scikit-learn中的主成分分析-实验室介绍。现在您已经看到了PCA的简要介绍,是时候使用scikit-learn自行运行PCA。

目标

在本实验中,您将:

  • 使用scikit-learn库实现PCA。

  • 通过观察解释方差确定执行PCA时n个分量的最佳数量。

  • 绘制分类实验的决策边界以直观地检查其性能。

鸢尾花数据集

要练习PCA,您将查看iris数据集。运行下面的代码以加载它。


from sklearn import datasets

import pandas as pd

iris = datasets.load_iris()

df = pd.DataFrame(iris.data, columns=iris.feature_names)

df['Target'] = iris.get('target')

df.head()

在执行PCA和可视化主要组件之前,获得有关您将使用的数据的更多上下文会很有帮助。运行下面的代码以可视化成对特征图。