【问题标题】:R - Instagram hashtag scrapingR - Instagram 主题标签抓取
【发布时间】:2020-12-28 21:25:57
【问题描述】:

我正在尝试访问有关帖子主题标签及其相关信息的信息。我正在尝试将 json 转换为 R - 使用以下

library(jsonlite)

hashtag <- "sponsored"
url_start <- str_glue("http://instagram.com/explore/tags/{hashtag}/?__a=1")
json <- fromJSON(url_start)

我收到此错误

Error in parse_con(txt, bigint_as_char) : 
  lexical error: invalid char in json text.
                                       <!DOCTYPE html> <html lang="en"
                     (right here) ------^

如果我使用单个用户,我可以得到一些东西,例如我自己的用户名而不是 {hashtag}。调查#'s 我只是不能让它工作。我目前认为这是他们阻止请求的 Instagram 问题?

【问题讨论】:

    标签: r json instagram


    【解决方案1】:

    实际上,如果您运行 httr::GET(url_start),您会看到您在尝试登录时被阻止。

    Instagram 已将您的 IP 列入黑名单。

    不要发送垃圾邮件,只需执行其他操作,然后等待 2-3 天,希望该阻止将被废除。

    一旦代码再次开始工作,请确保添加 Sys.sleep(sample(4:20,1)) 在你跑之前 json &lt;- fromJSON(url_start)

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2020-10-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-06-20
      • 1970-01-01
      • 2014-11-28
      • 2014-04-30
      相关资源
      最近更新 更多