课程大纲: 第一课 工作环境准备及数据分析建模理论基础 (2课时) 1. 课程介绍 2. Python语言基础及Python 3.x新特性 3. 使用NumPy和SciPy进行科学计算 4. 数据分析建模理论基础 a. 数据分析建模过程 b. 常用的数据分析建模工具 5. 实战案例:科技工作者心理健康数据分析(Mental Health in Tech Survey) 第二课 数据采集与操作 (2课时) 1. 本地数据的采集与操作 a. 常用格式的本地数据读写 b. Python的数据库基本操作 2. 网络数据的获取与表示 a. BeautifulSoup解析网页 b. 爬虫框架Scrapy基础 3. 回归分析-- Logistic回归 4. 实战案例:获取国内城市空气质量指数数据 第三课 数据分析工具Pandas (2-3课时) 1. Pandas的数据结构 2. Pandas的数据操作 a. 数据的导入、导出 b. 数据的过滤筛选 c. 索引及多重索引 3. Pandas统计计算和描述 4. 数据的分组与聚合 5. 数据清洗、合并、转化和重构 6. 聚类模型 -- K-Means 7. 实战案例:全球食品数据分析(World Food Facts) 第四课 数据可视化 (2课时) 1. Matplotlib绘图 2. Pandas绘图 3. Seaborn绘图 4. 交互式数据可视化 -- Bokeh绘图 5. 实战案例:世界高峰数据可视化 (World's Highest Mountains) 第五课 时间序列数据分析 (2课时) 1. Python的日期和时间处理及操作 2. Pandas的时间序列数据处理及操作 3. 时间数据重采样 4. 时间序列数据统计 -- 滑动窗口 5. 时序模型 -- ARIMA 6. 实战案例:股票数据分析 第六课 文本数据分析 (2课时) 1. Python文本分析工具NLTK 2. 分词 3. 情感分析 4. 文本分类 5. 分类与预测模型 -- 朴素贝叶斯 6. 实战案例:微博情感分析 第七课 图像数据处理及分析 (2课时) 1. 基本的图像操作和处理 2. 常用的图像特征描述 3. 分类与预测模型 -- 人工神经网络 4. 实战案例:电影口碑与海报图像的相关性分析 第八课 机器学习基础及机器学习库scikit-learn (2课时) 1. 机器学习基础 2. Python机器学习库scikit-learn 3. 特征降维 -- 主成分分析 4. 实战案例:识别Twitter用户性别 (Twitter User Gender Classification) 第九课 项目实战:通过移动设备行为数据预测使用者的性别和年龄(2课时) 1. 交叉验证及参数调整 2. 特征选择 3. 项目实操 4. 课程总结