颜色分类leetcode生成数据-实验室介绍

在本实验中,我们将练习我们在上一课中看到的一些数据生成技术,以生成用于回归和分类目的的数据集。我们将运行几个简单的模拟,通过控制数据生成过程中的噪声方差参数来帮助我们生成不同的数据集。我们还将查看统计指标和视觉输出,以了解这些参数如何影响算法的准确性。

目标

在本实验中,您将:

  • 分类问题生成数据集

  • 回归问题生成数据集

生成分类数据

使用make_blobs()创建一个包含100个样本、2个特征和2个中心(其中每个中心对应一个不同的类标签)的二元分类数据集。设置random_state = 42以实现可重复性。

提示:这是一个用于生成数据的代码块。


# Your code here

将在数据pandas数据帧称为df,并检查数据的前五行。

提示:您的数据框总共应该有三列,两列用于特征,一列用于类标签。


# Your code here

创建数据的散点图,同时对不同的类进行颜色编码。

提示:您可能会发现将类标签映射到颜色的字典很有用:


colors = {0: 'red', 1: 'blue'}

# Your code here