其实很早就想写一个爬虫专栏了,这次就我以前写的一点点爬虫做个整理,我比较喜欢用lxml,json提取和正则表达式进行爬虫,Scrapy用得不多,bs4呢不怎么喜欢,关于反爬例如CSS和字体库略有了解但不深入,对于ajax和动态爬取会那么一点,selenium等库的操作不怎么会。。。MongoDB和mysql的基本操作会一丢丢,也会写出来,多线程也有涉及。关于一些爬虫工具也会贴出来。数据分析也会有有对应内容,针对pandas和numpy库,也会有关于pyecharts,matplotlib的画图操作,以及wordcloud词云操作。有些地方可能写的比较简单直接贴代码了,不懂的可以私信我,程序都是