【发布时间】:2017-02-05 02:59:47
【问题描述】:
我正在制作一个程序,其中一个部分是找出教科书的最佳回购价格。我正在尝试从“https://bookscouter.com”中抓取值,例如“https://bookscouter.com/prices.php?isbn=1285428226&searchbutton=Sell”的值是 34$。问题是该网站绝对不是静态的,简单的 python 抓取并不能真正起作用。我该怎么办?某种要求?我对网络工作不是很有经验,所以任何建议都将不胜感激。最好的,
【问题讨论】:
-
首先从网站上抓取信息是非常不可靠的,我建议查看一些 API 来获取需要的信息。例如directtextbook.com/api.php。如果你确实需要废弃一个站点,那么对于 python 来说,硒是一个不错的选择。 - selenium-python.readthedocs.io/api.html
标签: php python html request screen-scraping