基于Docker容器的分布式爬虫的设计与实现

xiaoziqie_590 8 0 PDF 2021-01-15 21:01:45

随着互联网的快速发展,信息量也随之快速增长。为了快速地获取特定的有效信息,通过对开源爬虫框架Scrapy的学习研究,结合Redis数据库和MongoDB数据库,设计并实现了一个分布式网络爬虫系统。此次针对58同城租房信息进行爬取,网页数据存入MongoDB数据库,网页链接存入Redis数据库,着重对反爬虫问题进行处理优化,并使用Docker容器对传统部署环境进行了改造。运行结果表明,基于Docker的分布式爬虫系统比基于VM的分布式爬虫系统运行效率更高更稳定。

用户评论

暂无评论

基于zookeeper实现分布式锁

zooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是集群的管理者。提供了文件系统和通知机制。在开发项目的过程中，很多大型项目都是分布式部署的，那么我们现在使用zookeeper实现

28 2020-07-25
论文研究基于Docker的容器云平台设计与实现.pdf

基于Docker的容器云平台设计与实现，方东旭，徐鹏，随着云计算技术的不断发展和云平台的火热商业化，越来越多的企业将复杂的IT应用迁移到云，然而传统的以虚拟机为最小资源调度单位�

34 2020-01-10
基于Snort的分布式入侵检测系统的研究与设计

通过基于Snort的集中式网络入侵检测系统,论述了基于Snort的分布式入侵检测系统框架在网络中的构建思路与实现方法,设想通过层次化的分布式结构实现分布式检测与集中式管理的统一,有效解决校园网络所面临

17 2020-07-21
网络分布式文件系统NDFS的设计与实现

 分布式文件系统能够有效地解决分布式系统中海量数据存储和I/O瓶颈问题,分布式文件系统是任何大规模分布式计算环境的重要组成部分,它的性能直接影响着整个分布式计算环境的执行效率。通过系

5 2021-02-01
分布式I O日志收集系统的设计与实现

随着存储系统的快速发展,以及实际应用中对存储系统的要求日益苛刻,为了研究存储系统I/O子系统的运行形态,设计并实现了一种分布式I/O日志收集系统,该系统能够通过总控制台同时控制分布式系统的多个节点并行

10 2020-08-20
分布式整流桥测试系统的设计与实现

分布式整流桥测试系统的设计与实现―16―仪表技术2006年第3期分布式整流桥测试系统的设计与实现王彦芳,王小平,刘利贤,胡小娟(石家庄铁道学院,河北石家庄050043)　　摘要:针对整流桥测试设备中存

1 2022-06-30
分布式无线农业信息采集系统的设计与实现

提出了一种基于nRF905的前端分布式无线传感器采集系统,将农业信息采集后无线传输至中心节点,由其经GSM网络转发至数据中心的决策支持系统进行数据处理和图形化显示,以辅助决策。介绍了无线采集终端的

5 2021-04-21
分布式多串口步进电机控制的设计与实现

摘要:设计了一种基于串口扩展卡的分布式步进电机控制系统。采用串口扩展卡扩展RS-232串口数,每个串口对应一个单片机。计算机通过选择串口的方式与单片机进行通信,进而控制单个步进电机。整个系统易于扩展

6 2021-04-21
分布式I O日志回放系统的设计与实现

随着存储系统的快速发展，需要对不同存储系统的性能进行评测，以I／O日志为基础在实际应用环境中测试存储系统性能，更为客观和准确。提出了一种分布式环境下日志回放系统，通过中央控制器，能够方便地控制多个节点

33 2019-01-02
Node.js基于HeadlessChrome开发分布式爬虫

基于HeadlessChrome开发分布式爬虫，DistributedcrawlerpoweredbyHeadlessChrome

17 2020-03-26

基于Docker容器的分布式爬虫的设计与实现

用户评论

推荐下载