【问题标题】:Searching for new tweets on Twitter using RTweet's search_tweets() function使用 RTweet 的 search_tweets() 函数在 Twitter 上搜索新推文
【发布时间】:2019-07-06 00:52:49
【问题描述】:

我正在从使用 twitteR 切换到 Rtweet 以自动搜索 Twitter 以查找新推文(twitteR 似乎将文本截断为 140 个字符)。 twitteR 包中的 searchTwitter() 函数包含 sinceID这个参数让我可以轻松地只搜索最新的推文并将它们附加到我现有的数据集中。我在Rtweet 包的search_tweets() 函数中找不到类似的函数。有什么方法可以避免下载整个推文语料库然后删除重复项,而只下载最新的推文?

这是我目前使用的函数和示例:

library(tidyverse)
library(tidytext)
library(twitteR)

# FUNCTION ----------
searchtwitterlastweek_ft <- function(topic, sinceID){
  today <- as.character(Sys.Date())
  lastweek <- as.character(Sys.Date() - 6)
  searchtwitterfortopic <- searchTwitteR(topic, n = 15000, since = lastweek, until = today, sinceID = sinceID)
  if(!length(searchtwitterfortopic) == 0){
    twListToDF(searchtwitterfortopic)
  } else {
    data.frame(list())
  }
}

# LOAD DATASET FROM PREVIOUS WEEKS ---------
load("DATA/rstats.Rda")

df_r <- df_r %>%
  arrange(desc(id))

# figure out last ID, i.e. last tweet on subject
lastid <- first(df_r$id)

df_temporary <- searchtwitterlastweek_ft("#rstats", lastid)

df_r <- rbind(df_r, df_temporary) %>%
  arrange(desc(id))

【问题讨论】:

  • 所以你不是在“抓取”,你只是在 API 上运行预定的搜索。
  • 感谢您标记此问题,我调整了问题以使其更清晰。

标签: r twitter rtweet


【解决方案1】:

看看 rtweet 包的 stream_tweet 函数应该可以帮助你 =)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-01-11
    • 2020-02-29
    • 1970-01-01
    • 2011-08-29
    • 2013-08-19
    • 2012-09-26
    • 1970-01-01
    • 2015-09-03
    相关资源
    最近更新 更多