【发布时间】:2018-07-31 12:40:58
【问题描述】:
我正在使用 Rcrawler 提取维基百科页面的信息框。我有一个音乐家列表,我想提取他们的姓名、出生日期、死亡日期、乐器、标签等。然后我想将列表中所有艺术家的数据框创建为行并将数据存储为列/向量。
下面的代码没有抛出任何错误,但我也没有得到任何结果。代码中使用的xpath在我单独使用rvest时有效。
我的代码有什么问题?
library(Rcrawler)
jazzlist<-c("Art Pepper","Horace Silver","Art Blakey","Philly Joe Jones")
Rcrawler(Website = "http://en.wikipedia.org/wiki/Special:Search/", no_cores = 4, no_conn = 4,
KeywordsFilter = jazzlist,
ExtractXpathPat = c("//th","//tr[(((count(preceding-sibling::*) + 1) = 5) and parent::*)]//td",
"//tr[(((count(preceding-sibling::*) + 1) = 6) and parent::*)]//td"),
PatternsNames = c("artist", "dob", "dod"),
ManyPerPattern = TRUE, MaxDepth=1 )
【问题讨论】:
标签: r web-scraping rcrawler