本资源包含了网络爬虫设计的基本思想。主要可以分为这样几个部分:控制器、下载器、解析器、下载器和持久化等这些部分。可以爬取没有反爬取的网络的电子文档和图片。只适用于utf-8编码格式,不能获取视频和音频等。