【发布时间】:2018-11-14 04:16:46
【问题描述】:
我正在尝试从以下链接下载文件并自动读取其信息:
问题是当我尝试阅读 pdf 上的信息时,我得到一个错误。它似乎时断时续,我看不出一个很好的理由。该错误似乎仅限于 Linux。
library(pdftools)
link = "http://www.leyes.congreso.gob.pe/Documentos/2016_2021/Proyectos_de_Ley_y_de_Resoluciones_Legislativas/PL0361420181108.pdf"
download.file(link, "somefile.pdf")
pdf_info("somefile.pdf")
Error in poppler_pdf_info(loadfile(pdf), opw, upw) :
Embedded NUL in string.
我还尝试了什么:
- 尝试使用 mode = "wb" 下载
- 尝试使用 httr 使用 write_disk 方法下载
- 尝试在windows上手动下载,成功了! :(
我怀疑这与我下载文件的方式有关。但是,我不知道我应该尝试什么替代方案。
【问题讨论】: