【发布时间】:2021-12-12 03:40:57
【问题描述】:
这个简单的代码...
url1 <- 'https://www.sec.gov/Archives/edgar/data/0001336528/0001172661-21-001865.txt'
data1 <- readLines(url1)
...导致以下错误消息:
我尝试了很多方法,我得出的结论是,当我的请求是由 R(使用该代码或任何代码)发出时,该站点拒绝了我的请求。有时,我没有出错,代码运行良好,但通常没有。我总是可以直接从浏览器保存 .txt(我无法使用 R 将其保存到我的电脑),然后从我的电脑中的文件导入。
示例 -> 我将页面另存为 .txt,然后
data1 <- readLines("Persh01.txt")
由于它有时会工作,我还创建了一个循环尝试直到完成,它完成了工作,但我更换了电脑,它似乎不再工作了。
data1 <- NA
data1 <- try(readLines(url1))
while (inherits(data1, "try-error")) {
data1 <- try(readLines(url1))
}
有人会帮助我吗? 谢谢
【问题讨论】:
标签: r web-scraping http-status-code-403