针对时光网抓取数据 爬虫

qq_56004 35 0 RAR 2019-06-27 05:06:34

Grab data for Time Network

用户评论
请输入评论内容
评分:
Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

可以使用,满足我现在需求,希望分数再合理一点,8分有点高。

Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

能够学习到爬虫的一些基础知识

Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

正在做一个作业,用的就是这个,还挺不错的,但是貌似需要爬下来之后再进行处理才能用

Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

和我用的方法有点出入,但是还是直接借鉴一下!

Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

你做的时候他们的影讯是已经用异步方式获取的了吗

Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

很好,能够正常运行,获取内容需要进一步处理。

Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

楼主的代码是可行的,但是时光网的url格式已更改,分页等参数不再是写在url里了,没有解决我的问题,不过还是感谢分享!

Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

非常好,爬取到了很多数据!

Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

不知道怎么使用!请高人指点!

Generic placeholder image 卡了网匿名网友 2019-06-27 05:06:34

我不得不说这也算是爬虫????虽然引入了httpclient jar,但自始至终都没用到,只是使用htmlparser来获取内容,大部分都是对于业务的处理,没有什么实质的东西.总之根本算不上爬虫~~~~,浪费我那么多分~~~~