【问题标题】:Rselenium web scraping problemsRselenium 网页抓取问题
【发布时间】:2023-10-17 17:23:01
【问题描述】:

我正在尝试用 R 解析 HTML 以提取一些货币汇率。它们只有在点击网页中心的按钮后才能看到(抱歉,它是俄语的)。

到目前为止,我已经尝试了 Rselenium 和 rvest,但它们都不允许我使用这个 css:“tr:nth-child(2) td”。

如果我试试这个:

library("RSelenium")
startServer()
mybrowser <- remoteDriver(browserName = "chrome")
mybrowser$open()
mybrowser$navigate("https://www.tinkoff.ru/about/documents/exchange/")
dol<-mybrowser$findElement(using = c('partial link text'), "USD")

它返回一个“NoSuchElement”错误。

I've highlighted the place in the html code where I need to get

【问题讨论】:

    标签: r web-scraping rvest rselenium


    【解决方案1】:

    txt&lt;- ".documents-exchange-vertical-list__menu:nth-child(2) .documents-exchange-vertical-list__item+ .documents-exchange-vertical-list__item .Currency-Rate-Trigger";

    dol&lt;-mybrowser$findElement(using = 'css selector', txt)clickElement()

    #possibly this will work or may not dol<-mybrowser$findElement(using = 'css selector', "tr:nth-child(2) td:nth-child(1)")$getElementText()

    【讨论】: