颜色分类leetcode生成数据介绍数据分析通常需要分析师使用某种类型的数据来测试算法的效率/性能。在这种情况下,重点不是像我们之前看到的那样回答一些分析问题,而是测试一些机器学习假设,例如,比较两种不同的算法,看看哪一种算法的准确性更高。分析师通常会处理他们自己生成的合成随机数据。本实验和接下来的课程将重点介绍一些数据生成技术,您可以稍后使用这些技术来学习新算法,同时又不会过多地沉迷于领域知识。目标:您将能够:1. 确定数据科学家想要生成数据集的原因;2. 为分类问题生成数据集;3. 为回归问题生成数据集。练习数据集允许测试和调试算法,并测试其稳健性。它们还用于理解算法对模型参数变化的响应。以下是此类数据集优于现实世界数据集的一些原因:1. 快速简便的生成,节省数据收集时间和精力;2. 可预测的结果,对结果有更高的信心;3. 随机化,数据集可以重复随机化以检查多种情况下的性能;4. 简单的数据类型,更容易可视化数据和结果。在本课中,我们将介绍一些可以帮助我们生成随机数据集的Python函数,如make_blobs()
。
Generating Data NYC DS Career 042219: DSC 生成数据 (颜色分类)
文件列表
dsc-generating-data-nyc-ds-career-042219-master.zip
(预估有个12文件)
dsc-generating-data-nyc-ds-career-042219-master
.gitignore
64B
LICENSE.md
1KB
CONTRIBUTING.md
2KB
README.md
7KB
.learn
87B
index_files
index_27_0.png
6KB
index_29_0.png
6KB
index_22_0.png
7KB
暂无评论