【发布时间】:2020-05-02 10:13:48
【问题描述】:
我正在从网站上的表格中提取信息。该表的输出如下所示(见下文)。
1. Saturday
2. 4:00 PM
3. 5:30 PM
4. Sunday
5. 8:30 AM
6. 10:00 AM
我真的需要它像这样度过(见下文)。我不认为我可以使用 html_table() 函数对其进行转换,但我希望有人知道如何在 R 中重新格式化它。
1. Saturday 4:00 PM
2. Saturday 5:30 PM
3. Sunday 8:30 AM
4. Sunday 10:00 AM
这是我正在使用的代码:
urls <- 'https://www.life.church/edmond/'
times <- function(x){
try( x %>%
read_html()%>%
html_table(header = F)%>%
data.frame(x))
}
#Apply function to the urls
m <- lapply(urls, times)
#Convert to a dataframe
data <-data.frame(unnest(tibble(m)))
【问题讨论】:
标签: r web-scraping html-table reformatting