【问题标题】:Error with jsonlite package in RR中的jsonlite包错误
【发布时间】:2016-12-01 16:17:22
【问题描述】:

有没有人在尝试网络抓取网站时收到此错误:

Error in feed_push_parser(readBin(con, raw(), n), reset = TRUE) :
lexical error: invalid char in json text.
                                     <!doctype html><html xmlns="htt
                   (right here) ------^

我不明白为什么当我抓取网站的第一页时收到此错误,但第一页上的相同声明没有问题。但是第二页我得到了这个错误。有没有办法解决这个问题?

这很好用:

    jsonlite::fromJSON("https://www.reddit.com/r/BestOfStreamingVideo/.json", flatten = TRUE)

在此处获取错误:

jsonlite::fromJSON("https://www.reddit.com/r/BestOfStreamingVideo/?count=25&after=t3_5fvgls/.json", flatten = TRUE)

【问题讨论】:

    标签: html json r web web-scraping


    【解决方案1】:

    后者不返回 JSON。它返回 HTML。在浏览器中输入这两个 URL,您会看到不同之处。

    我猜你要找的网址是:

    https://www.reddit.com/r/BestOfStreamingVideo/.json?count=25&after=t3_5fvgls/

    你需要把./json放在前面,然后附加URL参数。

    【讨论】:

    • 谢谢,谢谢,谢谢! :D
    猜你喜欢
    • 2023-03-12
    • 2016-05-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多