亚马逊图书刮板 描述 旨在刮擦Amazon HTML页面以获取产品详细信息,并比较数学书籍的书本价格。 我想在没有开销预算的情况下做到这一点,并且对于要尽可能地简单,因此无法使用需要AWS的Amazon 。 当前状态 该代码库当前使用一个Amazon URL,并从页面中抓取HTML。 它通过遍历多种客户端类型(台式机/移动设备),搜索这些客户端类型,扫描HTML,查找页面上所有产品的外观并进行打印来做到这一点。 注意:赞助书籍将被忽略-目前 预期的URL格式 预期的URL格式可以在...之后找到。 在Amazon中完成您想要的书的搜索 单击搜索底部的页面按钮(用于自动格式化) 复制网址。 附加格式详细信息 例子: https://www.amazon.com/s?k=python+scraping&page=1&qid=1567979575&ref=sr_pg_1 - mus