本文通过C++实现了一个基于广度优先算法的多线程爬虫程序。本论文阐述了网络爬虫实现中的一些问题:为何使用广度优先的爬行策略,以及如何实现广度优先爬行;为何要使用多线程,以及如何实现多线程;系统实现过程中的数据存储;网页信息解析等。