task03 特征工程.md
特征工程主要进行以下一些操作: 1.导入数据 2.删除异常值:截断过大或过小值的数据 3.特征构造: - 广告发布时间:将年、月、日信息单列出来 - 汽车使用时间=广告时间-注册时间 - 城市信息=邮政编码后三位 - 销售统计量:比如价格的最大最小值、中位数、均值、方差等 4.数据分桶:对功率等数值型变量分桶 5.特征筛选:通过相关系数找出对结果影响较大的变量
用户评论
推荐下载
-
特征工程决定了结果的上限
一、异常值处理 # 箱线图(3-Sigma)删除异常值 def outliers_proc(data, col_name, scale=3): """ 用于清洗异常值,默
5 2020-12-23 -
Spark数据处理与特征工程
sklearn在中小型数据集上,在工业界是在使用的 xgboost、lightgbm在工业界的实用度非常的高 工业界数据体量真的达到上亿或者十亿这样的规模用sklern处理起来是比较吃力的, 可借助于
17 2021-01-16 -
用于机器学习特征工程的哈希
Hashing for Machine Learning(用于机器学习特征工程的哈希),微软研究院 John Longford 的讲义。
13 2020-11-27 -
精通特征工程中文PDF.pdf
《精通特征工程的中文版》,还是蛮不错的,其中的一些都是自然语言处理。
792 2019-10-02 -
大数据分析之特征工程
数据建模和大数据分析过程中特征工程直接影响了数据质量和模型结果,是大数据分析在数据采样后的重要一步
38 2019-07-10 -
如何构建高效的特征工程方法
本文围绕特征工程与模型构建的关系,详细阐述了如何构建高效的特征工程方法。特别强调了数据清洗、特征选择和特征转换在建立特征工程管道中的重要性。此外,还介绍了如何评估特征工程的效果和优化方法。如果你想打造
5 2023-03-21 -
特征工程与集成学习浅谈.pptx
机器学习—特征工程和集成学习 介绍,包括sklearn的介绍,和随机森林,XGBoost, LightGBM和Catboost的介绍等
4 2020-08-10 -
数据表示和特征工程.ipynb
数据表示和特征工程是数据科学中的重要步骤,它们涉及将原始数据转换为机器学习算法可以处理的形式。在本文中,我们将讨论数据表示和特征工程的基本概念和技术,如数值特征编码、文本特征提取和特征缩放等。我们还将
10 2023-07-23 -
数据预处理与特征工程.LearningMaterials
数据预处理与特征工程的学习资料
11 2023-01-10 -
AutoML之自动化特征工程
个人以为,机器学习是朝着更高的易用性、更低的技术门槛、更敏捷的开发成本的方向去发展,且AutoML或者AutoDL的发展无疑是最好的证明。因此花费一些时间学习了解了AutoML领域的一些知识,并对Au
16 2021-02-01
暂无评论