【发布时间】:2019-07-13 21:15:01
【问题描述】:
之前,我发布了一个关于如何从 AJAX 网站获取数据的问题,该网站来自此链接:Scraping AJAX e-commerce site using python
我了解如何在“网络”选项卡中使用 chrome F12 获取响应并使用 python 进行一些编码以显示数据。但我几乎找不到它的特定 API url。 JSON 数据不像之前的网站那样来自 URL,而是在 Chrome F12 的 Inspect Element 中。
我真正的问题实际上是如何使用 BeautifulSoup 或与之相关的任何东西仅获取 JSON 数据?在我只能从 application/id+json 获取 JSON 数据之后,我会将其转换为 python 可以识别的 JSON 数据,以便我可以将产品显示为表格形式。
还有一个问题是我多次运行代码后,JSON 数据丢失。我认为该网站会阻止我的 IP 地址。我该如何解决这个问题?
这里是网站链接:
https://www.lazada.com.my/catalog/?_keyori=ss&from=input&page=1&q=h370m&sort=priceasc
这是我的代码
从 bs4 导入 BeautifulSoup 导入请求
page_link = 'https://www.lazada.com.my/catalog/?_keyori=ss&from=input&page=1&q=h370m&sort=priceasc'
page_response = requests.get(page_link, timeout=5)
page_content = BeautifulSoup(page_response.content, "html.parser")
打印(页面内容)
【问题讨论】:
标签: python json ajax beautifulsoup response