ITC数据挖掘项目 当前状态:这是一个正在进行的项目。 该自述文件当前详细介绍了从第一个检查点开始的进度,该检查点仅将数据刮到CSV文件中 描述 该网络抓取工具查找,抓取和存储Goodreads( )上的书籍的详细信息。 它通过选择用户的好书列表并抓取并存储该列表中所有书籍的详细信息来起作用。 Web刮板是作为ITC数据科学研究员计划( )的一部分而创建的。 用法 python3 main.py (如果未输入任何参数,则默认为本周在本国/地区阅读最多的内容。) 在哪里: 类型 细节 例子 most-popular [YYYYMM] most-popular 202001 most-read COUNTRYperiod most-read ILm new-releases genre new-re