【发布时间】:2023-03-12 03:34:01
【问题描述】:
我正在尝试生成一个脚本,从下载图标的这组链接的第一个链接here“Cleveland Fed Estimates of Inflation Expectations”中下载文件。
我知道如何获取具有永久 url 的文件,但在这种情况下,文件将定期更新,并且 URL 以及文件名会经常更改。
解决这个问题的最佳方法是什么?
【问题讨论】:
-
这不一定是 R 问题。我只会使用另一种脚本语言,更好地支持网络抓取(例如,Python + BeautifulSoup 或 PyQuery)。
-
@alexpmil 您可能需要仔细检查您的事实。 R 擅长网页抓取。
httr,rvest,xml2,XML -
@hrbrmstr 很高兴知道。情况并非总是如此。我想最好的答案是“使用你最擅长的网络抓取语言”。
标签: r