代码解释用selenium库访问目标页面,我这里通过_get_files_url方法定位输入框和超链接地址,然后返回超链接地址。之后在download_save方法内通过request.get拿到文件,然后存在本地,里面的一些存放目录、文件名处理等细节看代码就可以了。提取内容并填写使用到的库这部分用到time,xlwt,urllib,re,pickle,os,zipfile,BeautifulSoup这几个库。解压出来的文件比较冗杂,所以我用正则匹配了一个最合适的文件,这部分代码中的大部分工作都是为了拿到我的目标值,也就是,信息写入excel的过程倒不是很复杂。我基本上没有解释方法是因为这些百度一下或者看官网就行了,主要还是阐述一下我的编写思路
暂无评论