爬取一个用户的所有微博 利用selenium+PlantomJS登录+爬取感兴趣的用户的所有信息包括昵称,认证,粉丝,关注,所有微博以及每条微博的转发,评论数量等理论上来讲再加一个链接爬虫可以爬取新浪微博的所有数据但是由于用的是无壳浏览器导致登录和加载页面速度比较慢所以实际上基本不可能能实现爬取代码写完调通就没有管过了,也
58同城二手房出售信息 爬自58同城的216W条二手房数据,从mongoDB中导出的json文件,包含的字段有 1.详情页面url 2.房屋朝向 3.房屋房间数量(类似两室一厅这种) 3.from url 4.经纬度 5.字符串地址 6,爬取时间(时间戳格式) 7.所属城市(类似湖北武汉这种) 可以用于大数据分析,机器学习