在本实验中,我们将练习上一课中的数据生成技术,生成用于回归和分类的数据集。通过控制噪声和方差参数,帮助生成不同的数据集。我们还将查看统计指标和视觉输出,理解这些参数对算法准确性的影响。
目标
-
生成分类问题的数据集
-
生成回归问题的数据集
分类数据生成
使用make_blobs()
创建包含100个样本、2个特征、2个中心的二元分类数据集。设置random_state = 42
以实现可重复性。
# Your code here
提示:生成的数据框应有三列,两列用于特征,一列用于类标签。
数据可视化
colors = {0: 'red', 1: 'blue'}
# Your code here
暂无评论