【发布时间】:2023-07-17 21:59:01
【问题描述】:
我正在尝试从以下链接中抓取一些表格: 'https://www.pro-football-reference.com/boxscores/201209050nyg.htm' 从尝试多种方法/包中可以看出,我认为 R 无法读取整个 url。以下是我所做的一些尝试:
a <- getURL(url)
tabs <- readHTMLTable(a, stringsAsFactors = T)
和
x <- read_html(url)
y <- html_nodes(x,xpath= '//*[@id="div_home_snap_counts"]')
我已经成功地用这两种方法阅读了前两个表,但之后无论我使用 xpath 还是 css,我都无法阅读任何其他表。有谁知道为什么我没有阅读这些后来的表格?
【问题讨论】:
-
@Dev 我在这里没有真正看到问题 - OP 提供了一些代码并解释了工作和效果。
标签: r web-scraping rvest rcurl