【问题标题】:Loading ftp directly to R dataframe - how to see the original text?将 ftp 直接加载到 R 数据框 - 如何查看原文?
【发布时间】:2016-11-16 10:14:02
【问题描述】:

是否可以不下载直接将 ftp 文件加载到 R 工作区? 我有 700 多个文件,每个文件大约 1.5 Gb,我想从每个文件中提取大约 0.1% 的信息并将它们添加到单个数据框中。

我查看了Download .RData and .csv files from FTP using RCurl (or any other method),但无法正常工作。

编辑:经过一番阅读,我设法将文件放入 R

library(httr)
r <- GET("ftp://ftp.ais.dk/ais_data/aisdk_20141001.csv", write_memory())

当我尝试阅读我使用的正文时

content(r, "text")

但输出是乱码。这可能是因为编码,但我怎么知道服务器使用哪种编码。关于如何从 ftp 获取原始数据的任何想法?

【问题讨论】:

  • curl pkg 和httr pkg(使用curl pkg)可以“写入内存”而不是磁盘。是时候阅读这些 pkg 和实验的帮助页面了,尤其是因为您没有提供任何代码或 URL。

标签: r dataframe ftp


【解决方案1】:

我找到了一个非常简单但仍然有效的解决方案:

library(data.table)
r <- fread("ftp://ftp.ais.dk/ais_data/aisdk_20141001.csv")

This 博客很有帮助

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-07-11
    • 1970-01-01
    • 2017-07-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-05-11
    相关资源
    最近更新 更多