【发布时间】:2016-12-01 16:17:22
【问题描述】:
有没有人在尝试网络抓取网站时收到此错误:
Error in feed_push_parser(readBin(con, raw(), n), reset = TRUE) :
lexical error: invalid char in json text.
<!doctype html><html xmlns="htt
(right here) ------^
我不明白为什么当我抓取网站的第一页时收到此错误,但第一页上的相同声明没有问题。但是第二页我得到了这个错误。有没有办法解决这个问题?
这很好用:
jsonlite::fromJSON("https://www.reddit.com/r/BestOfStreamingVideo/.json", flatten = TRUE)
在此处获取错误:
jsonlite::fromJSON("https://www.reddit.com/r/BestOfStreamingVideo/?count=25&after=t3_5fvgls/.json", flatten = TRUE)
【问题讨论】:
标签: html json r web web-scraping