【问题标题】:Search Operators in RedditExtractoRRedditExtractoR 中的搜索运算符
【发布时间】:2015-08-19 23:42:57
【问题描述】:

我正在尝试建立一个流程来拉下与一组关键字相关的 Reddit 帖子和 cmets。 RedditExtractoR 包中的 get_reddit() 函数使这非常简单,但我不确定我是否正确使用了搜索词,而且我无法在包文档或在线中找到有用的详细信息。我还测试了可在 Reddit 网站上运行的搜索功能,如下所示,但没有成功。

使用下面的代码,我测试了一些术语,结果有点令人困惑。 (注意:在测试中,实际结果数可能会根据查询通过的次数略有不同。)

library(RedditExtractoR)
term <- "bank" # or "bank loan" or "bank, loan" etc.
test <- get_reddit(search_terms = term,
                   page_threshold = 10,
                   sort_by = "new")

"bank" 返回 196 条记录; "loan" 给出 157。但是,"bank, loan""bank loan" 每个给出大约 2700; "bank OR loan" 只给出 31。我希望 "bank, loan"/"bank loan" 给出不超过 196+157(=353)。

我错过了什么?

【问题讨论】:

    标签: r


    【解决方案1】:

    看来:

    term <- "bank or loan"
    

    被转换为bank+or+loan,这可以解释为什么你会得到意想不到的结果。在github 上检查这一行。

    所以我建议你尝试这样的事情:

    term <- "bank|loan" 
    

    现在我得到了大约 700 个结果。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-09-20
      • 2020-02-17
      • 2019-09-07
      • 1970-01-01
      • 2015-06-21
      • 2011-10-31
      • 1970-01-01
      相关资源
      最近更新 更多