【发布时间】:2015-02-03 10:28:41
【问题描述】:
我正在使用 urls http://example.com/post/X 抓取一个网站,其中 X 是一个从 1:5000 开始的数字
我可以使用此代码使用rvest 进行抓取:
website <- html("http://www.example.com/post/1")
Name <- website%>%
html_node("body > div > div.row-fluid > div > div.DrFullDetails > div.MainDetails > div.Description > h1") %>%
html_text()
Speciality <- website %>%
html_node("body > div > div.row-fluid > div > div.DrFullDetails > div.MainDetails > div.Description > p.JobTitle") %>%
html_text()
我需要代码来抓取网站上的所有页面,并将抓取的数据放在一个表格中,每个页面都在一个新行中。 请帮忙
【问题讨论】:
-
请先展示你的努力。
标签: r web-scraping rvest