【发布时间】:2015-08-19 23:42:57
【问题描述】:
我正在尝试建立一个流程来拉下与一组关键字相关的 Reddit 帖子和 cmets。 RedditExtractoR 包中的 get_reddit() 函数使这非常简单,但我不确定我是否正确使用了搜索词,而且我无法在包文档或在线中找到有用的详细信息。我还测试了可在 Reddit 网站上运行的搜索功能,如下所示,但没有成功。
使用下面的代码,我测试了一些术语,结果有点令人困惑。 (注意:在测试中,实际结果数可能会根据查询通过的次数略有不同。)
library(RedditExtractoR)
term <- "bank" # or "bank loan" or "bank, loan" etc.
test <- get_reddit(search_terms = term,
page_threshold = 10,
sort_by = "new")
"bank" 返回 196 条记录; "loan" 给出 157。但是,"bank, loan" 和 "bank loan" 每个给出大约 2700; "bank OR loan" 只给出 31。我希望 "bank, loan"/"bank loan" 给出不超过 196+157(=353)。
我错过了什么?
【问题讨论】:
标签: r