【发布时间】:2021-05-29 18:49:09
【问题描述】:
我和我的朋友正在尝试开发一个购物机器人。它必须尽可能快,因为产品可能会在几秒钟内用完。我们已经寻找了不同的方法来做到这一点,我们提出了 Selenium 和 Scrapy 以及其他 python 库,我们已经有一些工作了,但是执行手头的任务似乎太慢了。
我们已经考虑过不要抓取网页(选择产品、添加到购物车等),而是尝试制作一个机器人,它只向商店的服务器发送一个 HTML 发布请求,其中包含产品和其余信息必要的。我们在其他帖子中读到,这是通过 requests 库完成的,但是我们如何知道一个操作需要哪些信息和多少个帖子请求(例如,单击添加到购物车按钮会向服务器发送一些帖子请求,所以我们如何知道该请求中包含的信息以在我们的程序中模拟它?)
我们希望库能够使用 JavaScript 抓取网页,例如在单击按钮或从下拉菜单中选择项目时。我们遇到了一些无法做到这一点的库(例如 Scrapy)
此外,如果您知道另一种编程语言可能更好的库或执行速度更快,我们将不胜感激,我们都知道 Python 和 Java,但我们愿意接受建议
【问题讨论】:
-
不确定是否可以制作API,因为您可能需要授权。公开的开放 API 存在,但我不认为你是幸运的。
标签: selenium web-scraping scrapy http-post bots