颜色分类leetcode dsc generating data lab dc ds career 042219:dsc 生成 ...
颜色分类leetcode生成数据-实验室介绍:在本实验中,我们将练习上一课中介绍的一些数据生成技术,以生成用于回归和分类目的的数据集。我们将运行几个简单的模拟,通过控制数据生成过程中的噪声和方差参数,帮助生成不同的数据集。我们还将查看统计指标和视觉输出,以了解这些参数如何影响算法的准确性。
目标:在本实验中,您将:
-
为分类问题生成数据集
-
为回归问题生成数据集
生成分类数据:使用make_blobs()
创建一个包含100个样本、2个特征和2个中心(每个中心对应一个不同的类标签)的二元分类数据集。设置random_state = 42
以实现可重复性。
提示:这是. # Your code here将在数据pandas
数据帧中称为df
,并检查数据的前五行。提示:你的数据框总共应该有三列,两列用于特征,一列用于类标签。
创建数据的散点图,同时对不同的类进行颜色编码。提示:您可能会发现将类标签映射到颜色的字典很有用:
colors = {0: 'red', 1: 'blue'}