Ta上传的资源 (0)

数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。 数据库是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合,可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行

可直接执行的安装包,省去繁琐操作,直接下载安装 Python是一种跨平台的计算机程序设计语言。 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发

缺失预处理数据22222.csv,用于学习缺失值处理的数据 impute.SimpleImputer 这个类是专门用来填补缺失值的。它包括四个重要参数 missing_values 告诉SimpleImputer,数据中的缺失值长什么样,默认空值np.nan strategy 我们填补缺失值的策略,

对已经发生过的事实的影响因素当作输入, 事件结果当作输出 以此来发现事物之间的规律,来预测 短暂未来中是否会发生某件事情的概率,或者收入估值 实际上 任何 的预测回归问题,都可以通过 tensorflow的深度学习来实现 预测分析

比赛概述 影响房价的因素有很多,在本题的数据集中有79个变量几乎描述了爱荷华州艾姆斯(爱荷华州艾姆斯)住宅的方方面面,要求预测最终的房价。 技术栈 特征工程(创意要素工程) 回归模型(高级回归技术,例如随机森林和 梯度增强) 最终目标 预测出每间房屋的价格,对于测试集中的每一个Id,指定SaleP

泰坦尼克号生存者预测数据,用于机器学习各方面,数据预测,建模等等,生存与否与性别,年龄,阶层等因素是有关系的,如果把这些因素作为特征,生存的结果作为预测目标,就可以建立一个典型的二分类机器学习模型。在这个项目中提供了部分的乘客名单,包括各种维度的特征以及是否幸存的标签,存在train.csv文件中,

因为教程中涉及一些数据用于建模的,这些数据是整理好的,供大家下载 (150000,11)行,列,数据内容是银行的制作评分卡数据,用评分本质上是模式识别中的一类分类问题,将企业或者个体消费者划分为能够按期还本付息(即“好”客户)和违约(即“坏”)两类。 具体做法是根据历史数据中的样本,从已知的数据中

Kaggle是一个大数据的众包平台,也是一个很好的项目实践场所。Kaggle的项目分为练习项目和奖励项目。今天写的DigitRecognizer属于练习项目,最后的结果只按照测试集的正确率计算排名,没有奖励。解决方案的python代码在Github开源平台上。 DigitRecognizer任务 此