【问题标题】:Hydrating Tweets补水推文
【发布时间】:2020-08-07 15:50:37
【问题描述】:

大家! 我正在使用 COVID 19 推文进行研究。我从 https://zenodo.org/record/3970127#.Xy12rChKiUk 下载了一些源自 COVID 19 的推文。但是,数据仅包括 Twitter ID。有谁知道如何在 RStudio 中水合数据并获取带有文本的 JSON 文件?看来我可以使用 Twarc 包,但我想在 R 环境中完成整个过程,而不是在 Python 中。

【问题讨论】:

  • “水合”数据是什么意思?
  • 嗨,“水化”是当您只有推文的唯一 ID 时获取推文文本的过程。 Twitter 仅允许共享推文 ID,但不允许共享完整推文(参见 dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/…
  • 您可能会发现“Hydrator”很有帮助:github.com/DocNow/hydrator。 - 它是一个独立的应用程序,用于水合推文,可以将数据作为 .csv 格式获取,然后您可以在 R 中使用。
  • 听起来你正在寻找一个 R 包来抓取推文文本。不幸的是,包裹推荐在本网站上被认为是题外话。

标签: r json tweets


【解决方案1】:

我意识到这有点晚了,但这里有:Twarc 的包描述包括提到一个类似的 R 包——这将回答 OP 的问题。

“对于 R,有 AcademictwitteR。与 twarc 不同,它只专注于查询 Twitter Academic Research Product Track v2 API 端点。如果您使用以下方法将数据导出到 CSV,则可以将在 twarc 中收集的数据作为数据帧导入 R 进行分析twarc-csv。”

Here 是来源。

【讨论】:

    猜你喜欢
    • 2017-05-26
    • 2020-12-23
    • 2018-06-01
    • 2022-10-06
    • 1970-01-01
    • 1970-01-01
    • 2018-03-30
    • 2019-06-09
    • 1970-01-01
    相关资源
    最近更新 更多