【发布时间】:2021-02-06 22:58:11
【问题描述】:
我对网络抓取非常陌生,并试图从链接中抓取所需的内容。
这是上图的实际网址:https://ssb.bannerprod.memphis.edu/prod/bwckschd.p_get_crse_unsec
我希望输出如下所示:
Sections Found Instructors email id
Academic Strategies - 10582 - ACAD 1100 - 001 Beverly McPhail
Academic Strategies - 10586 - ACAD 1100 - 002 Emily K Mann
Academic Strategies - 10590 - ACAD 1100 - 005 Christopher D Bourque
我看到email id 不可见,我只能看到符号。我在 R 中看到了 rvest 包并开始使用如下所示,但我看到一个错误:
library(rvest)
url <- read_html("https://ssb.bannerprod.memphis.edu/prod/bwckschd.p_get_crse_unsec")
Error in open.connection(x, "rb") : HTTP error 500.
去图片中的数据:
In this link `https://ssb.bannerprod.memphis.edu/prod/bwckschd.p_disp_dyn_sched`
Select by term -> Spring Term 2021 (view only) -> Submit
Subject -> select ACAD Academics -> scroll down and click Class Search
这会将您带到链接https://ssb.bannerprod.memphis.edu/prod/bwckschd.p_get_crse_unsec
我可以知道如何在 R 中进行这种类型的抓取吗?比q
【问题讨论】:
标签: html r xml web-scraping rvest