【发布时间】:2020-01-28 03:15:45
【问题描述】:
说明
我正在抓取网页以检索相关数据。作为示例,我将使用此 URL:
示例
https://isbnsearch.org/search?s=THE+GODFATHER+%2C+Mario+Puzo
我的第一次迭代基本上是搜索“教父,马里奥·普佐”,结果显示在发布的 URL 中。
问题
我正在尝试使用read_html(),但我不知道在html_nodes() 函数中包含什么来检索任何有意义的数据。我尝试使用 'table' 或类似的东西,但没有奏效:返回一个空列表。
最终目标是获得第一个搜索结果的 ISBN-13 或 ISBN-10。我可以解决这个问题,我只需要访问数据。
我假设*解决方案看起来像:
url <- 'https://isbnsearch.org/search?s=THE+GODFATHER+%2C+Mario+Puzo'
data<-read_html(url) %>% html_nodes("something") %>% #maybe another function
但我不知道,希望有人能提供帮助。
提前致谢。
【问题讨论】:
标签: r web-scraping rvest