【发布时间】:2019-02-13 20:56:01
【问题描述】:
刚接触编程并尝试从以下站点抓取数据。当我运行下面的代码时,它返回一个空的数据集或表。任何帮助或替代方法将不胜感激。
url <- "https://fasttrack.grv.org.au/Dog/Form?id=2003010003"
tab <- url %>% read_html %>%
html_node("dogruns_wrapper") %>%
html_text()
View(tab)
已尝试使用 xpath 和相同的结果,并且 html_table() 而不是文本返回错误,即没有适用于 'html_table' 的方法应用于类“xml_missing”的对象。
【问题讨论】:
-
我认为使用 rvest 无法完成,因为该表是通过 JavaScript 生成的。您应该尝试使用 RSelenium/splashr 或其他一些 JavaScript 渲染服务。
-
谢谢米斯拉夫。我会调查这些。
标签: r web-scraping rvest