neurips_crawler 获取输入年份的所有NeurIPS论文。 该代码的灵感来自@benhamner的。 要使用此脚本,您应该首先设置一个虚拟环境,然后运行 pip install -r requirements.txt 然后,您可以运行下面的代码,从每年的from_year到to_year ,开始抓取每个NeurIPS会议的所有PDF。 输出将存储在./output (默认)文件夹中。 执行日志将存储在crawler_log.txt (默认)。 python src/neurips_crawler.py --from_year=1998 --to_year=2018 --o