【发布时间】:2020-08-07 15:50:37
【问题描述】:
大家! 我正在使用 COVID 19 推文进行研究。我从 https://zenodo.org/record/3970127#.Xy12rChKiUk 下载了一些源自 COVID 19 的推文。但是,数据仅包括 Twitter ID。有谁知道如何在 RStudio 中水合数据并获取带有文本的 JSON 文件?看来我可以使用 Twarc 包,但我想在 R 环境中完成整个过程,而不是在 Python 中。
【问题讨论】:
-
“水合”数据是什么意思?
-
嗨,“水化”是当您只有推文的唯一 ID 时获取推文文本的过程。 Twitter 仅允许共享推文 ID,但不允许共享完整推文(参见 dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/…)
-
您可能会发现“Hydrator”很有帮助:github.com/DocNow/hydrator。 - 它是一个独立的应用程序,用于水合推文,可以将数据作为 .csv 格式获取,然后您可以在 R 中使用。
-
听起来你正在寻找一个 R 包来抓取推文文本。不幸的是,包裹推荐在本网站上被认为是题外话。