【发布时间】:2019-07-22 06:55:46
【问题描述】:
我正在尝试在 Aliexpress.com 上抓取有关产品的一些信息
我想要什么: 从每个变体图像中获取 data-spm-anchor-id 属性。
问题:在我尝试手动检查元素之前它不会加载
页面加载完成后尝试获取属性:
document.querySelector('.sku-property-image').querySelector('img')
结果:
<img src="https://ae01.alicdn.com/kf/HTB1HAk8UgHqK1RjSZFkq6x.WFXaB/Boruto-Naruto-Hoodies-Jacket-Men-3D-Hoodie-Akatsuki-Coat-Uchiha-Itach-Cosplay-Costume-Kakashi-Hoodies-Sweatshirts.jpg_50x50.jpg" title="2">
检查元素以查看 data-spm 是否存在:
然后在控制台上再次运行查询,您将看到:
<img src="https://ae01.alicdn.com/kf/HTB1HAk8UgHqK1RjSZFkq6x.WFXaB/Boruto-Naruto-Hoodies-Jacket-Men-3D-Hoodie-Akatsuki-Coat-Uchiha-Itach-Cosplay-Costume-Kakashi-Hoodies-Sweatshirts.jpg_50x50.jpg" title="2" data-spm-anchor-id="a2g0o.detail.1000016.i1.570f6bf9tarSlz">
data-spm-anchor-id attr 在检查元素后突然出现
我如何通过 puppeteer 或 Cheerio 以编程方式获得这个?
【问题讨论】:
标签: javascript jquery web-scraping puppeteer cheerio