【发布时间】:2021-01-21 18:48:49
【问题描述】:
我有一个抓取任务要做,我必须收集一些文章。我知道我只需要一些红色的段落 (#FF0000)。有没有办法使用 Selenium WebDriver 仅提取以这种颜色着色的那些?在我必须抓取的所有页面中,唯一始终相同的属性是文本颜色。
例如,在以下 URL 中:https://www.boatos.org/saude/ivermectina-mata-covid-dois-dias-dose-unica.html
我希望 webdriver 只返回以下最初用红色绘制的段落:
版本 1:“IVRMECTINA REALMENTE MATA COVID-19 EM 2 DIAS COMPROVA ESTUDO”。版本 2:“Cientistas descobriram que dose única de ivermectina pode remover todo o RNA do novo coronavírus em um período de 48 horas。 Mesmo no primeiro dia, a redução do material genético do vírus é significativo”。
【问题讨论】:
-
//span[@style='color: #ff0000;'] 将是一个简单的 xpath。
标签: python selenium-webdriver xpath css-selectors webdriverwait