【发布时间】:2015-07-11 18:08:27
【问题描述】:
为什么 youtube.com 的页面源无法抓取?
我尝试了以下方法(使用 phantomjs 以及带有 selenium 服务器的 chrome)
library(RSelenium)
pJS <- phantom(pjs_cmd = ...)
Sys.sleep(5) # give the binary a moment
remDr <- remoteDriver(browserName = 'phantomjs')
remDr$open()
remDr$navigate("https://www.youtube.com/")
remDr$getTitle()[[1]] # [1] "YouTube"
remDr$getPageSource()
返回:
Error in fromJSON(content, handler, default.size, depth, allowComments, :
invalid JSON input
【问题讨论】:
标签: r selenium youtube selenium-chromedriver rselenium