IMDb Scraper OMDb Database:该程序将为IMDb ID刮擦IMDb网站并使用OMDb API RESTful Web服务来检索每个ID的
IMDb抓取工具和OMDb数据库 该程序将为IMDb ID刮擦IMDb网站,并使用OMDb API RESTful Web服务来检索每个ID的数据。 然后将数据放入数据库中。 1. IMDb抓取器 BeautifulSoup库( )用于从构成IMDb页面HTML中提取数据。 从4个页面检索IMDb ID: 最高评分250部电影( ) 最高评分250场演出( ) 最受欢迎的100部电影( ) 最受欢迎的100个节目( ) 使用BeautifulSoup,可以找到所有带有“ wlb_ribbon”类的“ div”标签。 在这些标签中,将检索属性“ data-tconst”的值,该值对应于IMDB ID。 2.使用OMDb API检索数据 OMDb API是一种RESTful Web服务,用于获取电影信息,该网站上的所有内容和图像均由用户提供和维护。 在发出任何请求之前,请
文件列表
IMDb-Scraper-OMDb-Database-master.zip
(预估有个6文件)
IMDb-Scraper-OMDb-Database-master
.gitignore
2KB
program
clean_data.py
731B
retrieve_data.py
3KB
load_data.py
5KB
run.py
1KB
README.md
2KB
暂无评论