第1篇自己动手抓取数据 第1章全面剖析网络爬虫3 1.1抓取网页 1.1.1深入理解url 1.1.2通过指定的url抓取网页内容 1.1.3java网页抓取示例 1.1.4处理http状态码 1.2宽度优先爬虫和带偏好的爬虫 1.2.1图的宽度优先遍历 1.2.2宽度优先遍历互联网 1.2.3java宽度优先爬虫示例 1.2.4带偏好的爬虫 1.2.5java带偏好的爬虫示例 1.3设计爬虫队列 1.3.1爬虫队列 1.3.2使用berkeleydb构建爬虫队列 1.3.3使用berkeleydb构建爬虫队列示例 1.