Python数据处理采用基于项目的方法,介绍用Python完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括:Python基础知识,如何从CSV、Excel、XML、JSON和PDF文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和API中提取数据。 * 快速了解Python基本语法、数据类型和语言概念 * 概述数据的获取与存储方式 * 清洗数据并格式化,以消除数据集中的重复值与错误 * 学习何时对数据进行标准化,何时对数据清理进行测试并将其脚本化 * 使用Scrapy写网络爬虫 * 利用新的Python库和技术对数据集进