在本实验中,我们将练习上一课中的数据生成技术,生成用于回归和分类的数据集。通过控制噪声和方差参数,帮助生成不同的数据集。我们还将查看统计指标和视觉输出,理解这些参数对算法准确性的影响。

目标

  • 生成分类问题的数据集

  • 生成回归问题的数据集

分类数据生成

使用make_blobs()创建包含100个样本、2个特征、2个中心的二元分类数据集。设置random_state = 42以实现可重复性。


# Your code here

提示:生成的数据框应有三列,两列用于特征,一列用于类标签。

数据可视化


colors = {0: 'red', 1: 'blue'}

# Your code here