【发布时间】:2016-06-01 08:32:32
【问题描述】:
例如,我想从这个网页中抓取数据(空间、设施、价格...和评论 https://www.airbnb.com/rooms/9985824?guests=1&s=d2dNfFMd
我想为此目的使用 rselenium 包。 这是我的代码:
url <- "https://www.airbnb.com/rooms/9985824?guests=1&s=d2dNfFMd"
library('RSelenium')
pJS <- phantom()
library('XML')
shell.exec(paste0("C:\\Users\\Daniil\\Desktop\\R-language,Python\\file.bat"))
Sys.sleep(10)
checkForServer()
startServer()
remDr <- remoteDriver(browserName="chrome", port=4444)
remDr$open(silent=T)
然后在 SelectorGadget 的帮助下,我发现了适合抓取的元素:
var <- remDr$findElements('css selector','#details hr+ .row')
我的问题是:如何将它带入文本(字符串)? 或者可能存在其他使用 rselenium 收集数据的方法。
非常感谢
【问题讨论】:
标签: r web-scraping rselenium