特征工程(sklearn)

feiris35467 13 0 PDF 2021-02-01 12:02:50

本文来自于csdn,本文中使用sklearn中的IRIS(鸢尾花)数据集来对特征处理功能进行说明。有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面: 特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。首次接触到sklearn,通常会被其丰富且方便的算法模型库吸引,但是这里介绍的特征处

用户评论
请输入评论内容
评分:
暂无评论