【发布时间】:2017-12-02 19:26:30
【问题描述】:
我不太明白为什么我不能在某些带有 Rvest 的网站上使用选择器。
例子:
url <- read_html("http://www.cbc.ca/news/politics")
headlines <- url %>%
html_nodes(".headline") %>%
html_text()
另一个例子:
library(RSelenium)
rD <- rsDriver(verbose = FALSE)
rD
remDr <- rD$client
url <- "http://www.cbc.ca/news/politics"
remDr$navigate(url)
remDr$getTitle()
remDr$getCurrentUrl()
webElem <- remDr$findElement(using = "class", value = 'headline')
webElem$getElementAttribute("class")
remDr$close()
rD$server$stop()
应该足够简单。当我查看结构时,标题位于班级标题下方。除此之外,还有类 card-content、card-content-top 但似乎没有 CSS 选择器和 xpath 的组合起作用。
【问题讨论】:
-
我看不到课程标题或课程卡片内容 (?)
-
当我在开发者控制台中查看页面时,它就在那里。即使在使用 SelectorGadget 时,它也是被识别的 css 选择器。