采集 58同城 房产数据信息 | Java爬虫 & Jsoup

ajun55457 17 0 PDF 2020-12-23 00:12:30

一个数据采集系统(通俗的说就是爬虫),用来采集 58同城 房产 | 郑州中的房屋数据。使用 Java 语言和Jsoup库编写,这里分享给大家。 最后采集的数据结果 CSV 文件保存的,如下所示 说明 功能都集中在 spider.get58 包的如下4个类中: App: 应用驱动程序,控制爬虫的启动/运行逻辑和日志打印等; CrawUtil: 爬虫爬取单元,爬取特定的 url 返回 html 对象; DomParse: 从 html dom 中解析出需要的数据; House: Pojo,存储需要的数据信息。 用到的 Maven 依赖如下: org.jsou

用户评论
请输入评论内容
评分:
暂无评论