【发布时间】:2020-09-13 15:25:57
【问题描述】:
我正在尝试使用 R 代码从以下站点抓取前 4 页用于教育目的:
{r}
library(rvest)
library(purrr)
library(tidyverse)
url_base <- "https://www.boliga.dk/salg/resultater?searchTab=1&page=%d&sort=date-d&zipcodeFrom=1000&zipcodeTo=2499&street="
map_df(1:4,function(i){
page <- read_html(sprintf(url_base,i))
data.frame(Address = html_text(html_nodes(page,".font-weight-bolder.text-left")))
}) -> Address_map
View(Address_map)
此代码的唯一问题是它实际上并没有向我显示前 4 页,而是向我提供了四次第一页。
希望您能帮助解决这个小问题。
【问题讨论】:
-
非常感谢您的快速回复。你能推荐如何在R中编码吗?我尝试了一些解决方案,但没有一个真正给出相关结果。
标签: r web-scraping rvest