【发布时间】:2019-01-06 21:33:24
【问题描述】:
试图刮https://www.cefconnect.com/closed-end-funds-daily-pricing 将 rvest 用于 R 数据帧。继续尝试各种 css 和 xpath 选择器,但无法收集主数据表。
使用了 'table'、'tbody'、'td' 和 'tr xpath 选择器但没有成功。两列是超链接,其余是静态文本。
URL <- 'https://www.cefconnect.com/closed-end-funds-daily-pricing'
html <- read_html(URL)
html2 <- html %>%
html_nodes(xpath = '//table') %>%
html_nodes(xpath = '//td/a[1]/text()') %>%
html_text()
html3 <- as.data.frame(html2)
【问题讨论】:
标签: css xpath web-scraping rvest