关于爬虫数据存储问题,通常可以有三种选择: 文本文件(txt,json)或excel文件(csv,xlsx) 优势:使用方便,不需要第三方支持 劣势:健壮性差,扩展性差 数据库(mysql,mongoDB,redis,oracle...) 优势:良好的扩展性,使用广泛 劣势:需要第三方支持,对技术有一定要求 文件系统(hadoop) 更自由,但技术要求会更高