颜色分类leetcode dsc 2 23 06 data generation process lab seattle ds
颜色分类leetcode生成数据-实验室介绍
在本实验中,我们将练习在前一课中看到的一些数据生成技术,以生成用于回归和分类的数据集。我们将运行几个简单的模拟,通过控制数据生成过程中的噪声和方差参数来帮助生成不同的数据集。我们将查看统计指标和视觉输出,以了解这些参数如何影响算法的准确性。
目标:
-
你将能够:
-
为分类问题生成数据集
-
为回归问题生成数据集
任务1:创建函数reg_simulati
以运行回归模拟,使用 )make_regressi
数据生成函数创建多个数据集。 )
执行以下任务:
-
使用
n
(噪声)和随机状态输入参数创建reg_simulati
) -
使用给定的噪声值和随机状态制作具有100个样本的回归数据集(
X, y
) -
将数据绘制为散点图
-
计算并在图上绘制回归线并计算R²(可以在
statsmodels
或sklearn
中执行此操作) -
用噪声标记绘图,并计算R²
-
将固定的随机状态和来自[10, 25, 40, 50, 100, 200]值作为噪声值迭代地传递给上述函数
检查并评论输出。