基于Python的新浪微博用户数据采集与分析
针对微博用户添加的标签体现了其自身特点及兴趣的情况,为探索微博用户添加标签的行为及特点,首先利用Python与Web自动化工具基于广度优先策略抓取微博用户、用户关系、微博内容、微博评论等数据,并将其存储在数据库中。其次,利用Pandas分析了微博数量的分布情况、用户添加标签的行为及内容,通过使用Matplotlib将分析结果可视化,并利用k-means算法对添加标签的用户进行了聚类分析。由此通过基于用户标签的聚类分析结果可用于个性化推荐及舆情分析等方面。
用户评论
推荐下载
-
python新浪微博数据分布式挖掘
一:新浪微博接口之调用 二:新浪微博数据之分布式爬虫 三:基于hadoop-streaming分布式爬虫 四:单条微博数据抓取和统计视频展示 五:13亿用户关系(比例化)模型可视化视频展示
4 2020-11-28 -
python爬虫实例爬取新浪微博数据
可以大批量爬取微博数据,用于进行数据分析
26 2021-05-21 -
Spring Security将用户数据存入数据库
Spring Security 介绍到现在,我们还没连上数据库呢。不过,Spring Security 也给我们提供了一个它自己设计好的权限数据库,这里我们先来看看这是怎么回事!先来学这个简单的,然后
13 2022-05-02 -
新浪微博舆情分析
Sina Weibo public opinion analysis
59 2019-06-22 -
AD域分页查询全部域用户数据
AD域分页查询全部域用户数据
13 2020-10-28 -
UDP协议用户数据报协议demo
数据报UDP协议DatagramSocket
32 2019-09-14 -
XC886XC888用户数据手册
XC886/XC888 用户数据手册,内容详细,开发必备。
25 2019-01-14 -
用户数据文件夹迁移器
用户数据文件夹迁移器
28 2019-09-19 -
存储过程用户数据上传说明.docx
里面的每个表中的DWUserId都是同一个ID,看文档,不需要每个表中的都传一次,我只是将人物表拆开了;还有你这里还差登录注册表,里面的注册日期不需要更新。
5 2021-04-19 -
新浪微博
新浪微博SinaMinBlog_Api.exe
51 2019-09-27
暂无评论