【发布时间】:2016-08-19 08:05:20
【问题描述】:
我已经从 Stackoverflow 的用户那里得到了一些帮助,试图解决这个问题。然而,我遇到了新的麻烦:
URL <- "http://karakterstatistik.stads.ku.dk/Histogram/ASOB05038E/Summer-2015"
pg <- read_html(URL)
get_val <- function(x, label) {
xpath <- sprintf(".//table/tr/td[contains(., '%s')][1]/following-sibling::td", label)
html_nodes(x, xpath=xpath) %>%
html_text() %>%
trimws()
}
library("stringr")
trimmed = get_val(pg, "Karakter") %>%
str_replace_all(pattern = "\\n|\\t|\\r" ,
replacement = "")
trimmed
我想获取重考和考试的考试结果,但由于两个表的标题相同,R 只取重考的值。 具体来说,我想在标题 Resultater 下的两个表格中的成绩 12、10、7、4、02、00、-3 旁边获得“Antal”列
任何帮助将不胜感激! :)
【问题讨论】:
标签: html r screen-scraping