【发布时间】:2020-05-30 12:22:26
【问题描述】:
我想使用R的for循环函数从以下网站获取成绩数据:https://www7.nau.edu/pair/reports/ClassDistribution
为了获得表格数据,我必须先选择年份,然后选择学术学校。我需要 2015-2019 年和大学内所有学校(ACC、ACM、...、WGS)的数据。当我选择年份和学校时,网址没有改变,这就是我没有得到表格数据的原因。我非常感谢您的帮助和建议。我可以创建for循环,我只需要看看如何拉第一个表。
我正在为静态网站使用以下代码:
library(XML)
library(RCurl)
url <- "https://www7.nau.edu/pair/reports/ClassDistribution"
url.parsed <- htmlParse(getURL(url), asText = TRUE)
tableNodes <- getNodeSet(url.parsed, '//*[@id="pp_table"]/table')
grade_data <- readHTMLTable(tableNodes[[1]], header=F, stringsAsFactors=F)
【问题讨论】:
标签: r web-scraping