【发布时间】:2020-08-31 15:45:19
【问题描述】:
我已经阅读了多个其他类似的问题,但似乎无法找到一个给我正确答案的问题。
我正在尝试在 TeamWorkOnline.com 上抓取所有当前职位。
使用此代码开始抓取过程没有问题:
listings <- data.frame(title=character(),
stringsAsFactors=FALSE)
{
url_ds <- paste0('https://www.teamworkonline.com/jobs-in-sports?employment_opportunity_search%5Bexclude_united_states_opportunities%5D=0&commit=Search',i)
var <- read_html(url_ds)
#job title
title <- var %>%
html_nodes('.margin-none') %>%
html_text() %>%
str_extract("(\\w+.+)+")
listings <- rbind(listings, as.data.frame(cbind(title)))
}
但是,如果您查看该网站,底部有“编号导航”,可以继续到列出更多工作的其他页面。
我似乎不知道如何添加正确的代码以使 rvest 自动导航到其他页面并抓取这些作业。
任何帮助将不胜感激。
【问题讨论】:
标签: r web-scraping rvest