知乎爬虫&数据科学实战
知乎爬虫+NoSql+代码解耦合+数据科学聚类分析feature:1.破解知乎登录2.MongoDB进行数据化储存+缓存3.DFS深度优先遍历爬虫4.抓取用户信息写入csv5.对用户信息进行分词+k-means聚类,相似度推荐6.各个功能模块解耦合,装饰器模式详细的文档说明和简单问题回答:fjl2401@163.com
用户评论
推荐下载
-
知乎文本分类竞赛数据集12
https://biendata.com/competition/zhihu/ 参赛者需要根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型。 标注数据中包含 300
41 2019-02-16 -
Retrofit访问知乎新闻数据的简单demo
Retrofit访问知乎新闻数据的简单demo,做学习交流之用。
23 2019-03-14 -
知乎文本分类竞赛数据集22
https://biendata.com/competition/zhihu/参赛者需要根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型。标注数据中包含300万个问题
24 2019-07-05 -
深度学习的艺术知乎采铜自选集知乎盐系列
深度学习的艺术:知乎采铜自选集(知乎「盐」系列)
16 2019-05-13 -
微信小程序demo知乎日报附知乎日报API分析
小程序刚刚出来不就就火爆了整个前端圈, 咱也不干落后的研究了一下, 网上找了个”知乎日报API接口“做了个小项目练手, 基本上还算完整的实现了整个项目, 欢迎 star fork. 由于小程序对HTM
25 2021-04-07 -
Python使用Srapy框架爬虫模拟登陆并抓取知乎内容
里我们来看如何通过Python使用Srapy框架爬虫模拟登陆并抓取知乎内容的实例,要实现持续的爬取需要利用到cookie的保存,我们首先还是来回顾一下cookie的相关知识点:
21 2020-09-21 -
Python脚本模拟登录知乎爬虫操作excel微信公众号
Python脚本。模拟登录知乎, 爬虫,操作excel,微信公众号
32 2018-12-08 -
大数据爬虫实战
项目涉及技术Java、HttpClient、Redis、Solr、HBase、Zookeeper、HighChart、HTMLEmail&
34 2019-07-11 -
知乎架构变迁史.pdf
知乎架构变迁史.pdf
11 2021-01-14 -
仿知乎个人中心
模仿知乎app个人中心的沉浸式页面的小demo:ImitatZhihuDemo
7 2021-01-16
暂无评论