【发布时间】:2021-09-25 06:53:32
【问题描述】:
我正在尝试使用美联储 FOMC 会议纪要进行文本分析。
我能够从下面的链接获得所有指向相应 pdf 文件的链接。 https://www.federalreserve.gov/monetarypolicy/fomccalendars.htm
我试过 download.file(https://www.federalreserve.gov/monetarypolicy/files/fomcminutes20160316.pdf,"1.pdf")。
下载成功;但是,当我单击下载的文件时,它会输出“打开此文档时出错。文件已损坏,无法修复。” 有什么方法可以解决这个问题?这是在美联储一方防止网络抓取的一种方式吗?
我有 44 个链接(pdf 文件)要在 R 中下载和阅读。有没有办法在不实际下载文件的情况下做到这一点?
【问题讨论】:
标签: r nlp data-mining