【发布时间】:2021-01-13 01:08:16
【问题描述】:
我无法从此 HTML 代码中提取“添加到购物车”文本。我是网络抓取的新手,所以我不知道如何处理这个问题。我需要你的帮助。
<button data-t-events="A" data-t-e-var78="$ - Add To Cart" type="button" class="btn btn-primary btn-wide" data-reactid=".8.1.0">
<span data-reactid=".8.1.0.0" class="">ADD TO CART </span><i class="fa fa-caret-right" data-reactid=".8.1.0.1"></i></button>
我试过了
products = response.css('.btn-wide::text').extract_first()
print(products)
和
products = response.css('.btn-wide span::text').extract_first()
print(products)
【问题讨论】:
-
您可能将
print响应为空,因为在您的代码中我可以看到data-reactid=".8.1.0.0"。这意味着该网站正在使用 Reactjs。为了提取数据,你首先需要渲染它,以便scrapy可以看到button和span标签。尝试使用该网站的标题,您将能够使用您已经尝试过的上述代码提取Add to Cart。如果没有,请提供网站链接,我会帮助您。 -
我尝试使用这个网站curl.trillworks.com 在网络选项卡中获取标题,但我认为我没有复制正确的网络文件标题
标签: python html selenium beautifulsoup scrapy