【发布时间】:2020-12-24 16:29:07
【问题描述】:
我正在尝试使用 Selenium 抓取 Product Hunt
更具体地说,我正在尝试获取所有产品图标的源链接。
HTML:
我的爬取代码如下:
driver = webdriver.Chrome("<Your driver's path>")
driver.get("https://www.producthunt.com/topics/seo-tools?order=most-upvoted")
time.sleep(4)
icons = driver.find_elements_by_css_selector("div.styles_thumbnail__d2DAK.styles_thumbnail__XBHZ_ img")
print(len(icons))
print(icons)
driver.close()
问题是 selenium 只获得前 3 张图片,而不是所有可用的产品。
我已尝试增加睡眠时间,并与EC.presence_of_all_elements_located 一起实现了 driver.wait 方式,以确保正确加载所有图标。
【问题讨论】:
标签: python selenium xpath css-selectors webdriverwait