Ta上传的资源 (0)

本章从应用的角度出发,从数据质量分析和数据特征分析两个方面对数据进行探索分析。数据质量分析要求我们拿到数据之后先检测是否存在缺失值和异常值;数据特征分析要求我们在数据挖掘建模前,通过频率分布分析、对比分析、帕累托分析、周期性分析、相关性分析等方法,对采集的样本数据的特征规律进行分析,以了解数据的规律

python网络爬虫技术之基础讲解部分,着重讲解python的环境搭建以及相关基础知识的讲解。

该代码实现飞船大战外星人,而且随着难度的提升,飞船得分不断加大,最高分会显示在游戏屏幕顶部中心,飞船有三条命,该游戏可以帮助小主打法无聊的时光呢,希望大大们能得高分呦!

本章主要介绍了数据预处理的4个主要任务:数据清洗、数据集成、数据变换和数据规约。数据清洗主要介绍了对缺失值和异常值的处理,延续了第三章的缺失值和异常值分析的内容,本章主要介绍的处理缺失值的方法分为3类:删除记录、数据插补和不处理,处理异常值的方法有删除含有异常值的记录、不处理、平均值修正和视为缺失值

通过对百度新闻标题、链接、日期及来源的爬取,了解使用python语言爬取少量数据的基本方法,让网友老爷们得到真正的免费技术,扩充代码方面的知识。

python爬虫实战之实时数据挖掘,通过使用Selenium库实现对新浪财经股票实时数据、东方财富网、裁判文书网、巨潮资讯网的实时数据挖掘。由于这部分内容涉及爬虫进阶知识,所以我把这部分内容归于爬虫专栏,通过对一些网站的信息爬取,掌握了一些爬取方法以及爬虫技巧,还能熟练使用Python语言编写代码,