【问题标题】:R error HTTP status was '503 Service Temporarily Unavailable'R 错误 HTTP 状态为“503 服务暂时不可用”
【发布时间】:2017-05-04 08:30:58
【问题描述】:

我必须从http://www.kase.kz/ru/marketvaluation 网站下载几个 zip 文件

这个问题基本上来源于this话题。目前还没有解决问题,我尝试了以下方法:

for (i in 1:length(data[,2])){
    URL = data[i, 2]
    dir = basename(URL)
    download.file(URL, dir)
    unzip(dir)
    TXT <- list.files(pattern = "*.TXT")
    zip <- list.files(pattern = "*.zip")
    file.remove(TXT, zip)
}

现在我面临另一个问题 - 在第 4 次或第 5 次试验后,R 给了我:

trying URL 'http://www.kase.kz/files/market_valuation/ru/2017/val170403170409.zip'
Error in download.file(URL, dir) : 
  cannot open URL 'http://www.kase.kz/files/market_valuation/ru/2017/val170403170409.zip'
In addition: Warning message:
In download.file(URL, dir) :
  cannot open URL 'http://www.kase.kz/files/market_valuation/ru/2017/val170403170409.zip': HTTP status was '503 Service Temporarily Unavailable'

我不知道为什么会这样。我将不胜感激任何建议/解决方案。

【问题讨论】:

    标签: r web-scraping


    【解决方案1】:

    啊,这简直是小菜一碟:

    for (i in 1:length(data[,2])){
        URL = data[i, 2]
        dir = basename(URL)
        download.file(URL, dir)
        unzip(dir)
        TXT <- list.files(pattern = "*.TXT")
        zip <- list.files(pattern = "*.zip")
        file.remove(TXT, zip)
        Sys.sleep(sample(10, 1))
    }
    

    【讨论】:

      猜你喜欢
      • 2013-10-31
      • 2011-08-04
      • 1970-01-01
      • 2018-02-25
      • 1970-01-01
      • 2021-06-16
      • 1970-01-01
      • 2013-06-08
      相关资源
      最近更新 更多