java网络爬虫小程序

alban.wang 30 0 RAR 2021-04-18 08:04:50

设计并实现crawler 程序对 crawler 的功能要求如下,但不限于此: (1) 能够搜集本站内的所有网页,能提取出其中的URL 并加入到待搜集的URL 队列中,对非本网站域名的URL,只允许搜集首页,记录发现的URL 即可;对搜集的结果,产生2 个URL 列表:站内搜集URL、非站内(站外)发现URL; (2)使用User-agent 向服务器表明自己的身份; (3)能对HTML 网页进行解析,提取出链接URL,能判别提取的URL 是否已处理过, 不重复下载和解析已搜集过的网页; (4)能够对crawler 的一些基本参数进行设置,包括:搜集深度(depth)、文件类型、文件大

文件列表

crawler.rar (预估有个6文件)

crawler

实验1

Crawler实验报告.doc 347KB

crawler

Parser.java 923B

Fetcher.java 1019B

CallBack.java 486B

URLList.java 335B

Crawler.java 814B

用户评论

暂无评论

Python爬虫学习之翻译小程序

主要为大家详细介绍了Python爬虫学习之翻译小程序,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

10 2020-12-22
Java写得网络聊天室小程序

可以再浏览器里运行实现群聊和私聊，用Java编写的applet小程序实现了聊天的基本功能，简单易懂

20 2019-01-05
Java实现爬虫给App提供数据Jsoup网络爬虫

主要介绍了Java实现爬虫给App提供数据,即Jsoup 网络爬虫,感兴趣的小伙伴们可以参考一下

13 2020-10-28
网络爬虫爬虫软件

需要加载一个字典文件，此字典文件在爬虫程序中要求放在此目录结构下：c:\dictionary\dictionary.txt，词典默认认为是按照词语长到短的顺序排列的2、此爬虫程序爬到的网页内容存储

47 2020-04-27
基于VC的网络爬虫程序

用C++写的网络爬虫程序，结构严谨，适合入门者研究

40 2019-03-18
C#网络爬虫程序源码

网上找的一个C#写的网络爬虫程序源码，支持多线程，上传上来方便自己查看，有需要的朋友可以直接拿去参考，呵呵~~~谢谢作者。

40 2019-05-25
网络爬虫程序cngr_37527

么是网络爬虫(Spider)程序Spider又叫WebCrawler或者Robot，是一个沿着链接漫游Web文档集合的程序。它一般驻留在服务器上，通过给定的一些URL，利用HTTP等标准协议读取相应文

22 2019-05-04
C#的网络爬虫程序

c#写的非常完整的网络爬虫程序，源代码，绝对详细，值得下载！

45 2019-05-05
Spider网络爬虫程序_web开发

Spider又叫WebCrawler或者Robot，是一个沿着链接漫游Web文档集合的程序。它一般驻留在服务器上，通过给定的一些URL，利用HTTP等标准协议读取相应文档,然后以文档中包括的所有未访问

30 2020-05-14
网络爬虫larbin完整源程序

网络爬虫larbin完整源程序,内含配置文件,可以正确运行

19 2020-11-06

java网络爬虫小程序

文件列表

用户评论

推荐下载