【发布时间】:2013-05-28 03:46:13
【问题描述】:
我正在尝试从 ftp 服务器(我从 TRMM 存档数据中获得)下载 460,000 个文件。我列出了所有文件并将它们分成不同的作业,但是任何人都可以帮助我如何在 R 中同时运行这些作业。只是我尝试做的一个例子
my.list <-readLines("1998-2010.txt") # lists the ftp address of each file
job1 <- for (i in 1: 1000) {
download.file(my.list[i], name[i], mode = "wb")
}
job2 <- for (i in 1001: 2000){
download.file(my.list[i], name[i], mode = "wb")
}
job3 <- for (i in 2001: 3000){
download.file(my.list[i], name[i], mode = "wb")
}
现在我被困在如何同时运行所有作业上。
感谢您的帮助
【问题讨论】:
-
请参阅 StackOverflow 上的帖子“[运行多个 R 脚本/会话]”(stackoverflow.com/questions/7367026/…)。基本上,如果您正在考虑加快从 ftp 服务器下载文件的过程,那么同时下载它们可能不会比逐个下载快多少。您可以随时在 R 应用程序中打开第二个控制台窗口。
-
这个 TRMM 内容是否来自同一来源,提供一些方便的下载提示:mirador.gsfc.nasa.gov/cgi-bin/mirador/…,其中包括下载管理器和自定义工具?
-
只需为此编写一个python脚本。