【发布时间】:2017-04-21 14:00:22
【问题描述】:
我需要从这个网页下载几个 zip 文件 ....
使用 curl 或 wget,所以不是以交互方式,
示例网址如下...
http://www.geoportale.regione.lombardia.it/rlregis_download/service/package?dbId=323&cod=12
如果我在新的浏览器选项卡或窗口中使用此链接,一切正常,但使用 curl 或 wget 无法下载 zipfile。
尝试使用 Firebug 或一般浏览器控制台查看浏览器中发生的情况,我可以看到首先有一个 POST 请求,然后是一个 GET 请求(使用 Firebug ...),所以我无法使用 curl 或 wget 重现这些请求。
也可能是浏览器会话中设置了一些 cookie,如果没有该 cookie,链接将无法工作?
任何建议将不胜感激......
切萨雷
注意:当我尝试使用 wget 时,这是我的结果
注意 2:404 未找到
注意 3(解决方案):正确的命令是
wget "http://www.geoportale.regione.lombardia.it/rlregis_download/service/package?dbId=323&cod=12"
然后我必须将文件重命名为“pippo.zip”,这是我的结果,或者,最好以这种方式使用 -O 选项
wget "http://www.geoportale.regione.lombardia.it/rlregis_download/service/package?dbId=323&cod=12" -O pippo.zip
【问题讨论】:
-
使用 selenium 之类的工具怎么样?
-
我应该喜欢使用比 Selenium 更简单的东西......无论如何,你有使用 selenium 的示例吗?
-
我刚刚尝试了 wget,它对我有用...您看到的错误是什么?
-
真的吗?我在原始文本中添加了一个注释,其中包含我的 cygwin 会话的图片....如果您尝试查看文件的内容,您会发现有一个错误.....谢谢!
-
以后不需要重命名文件:可以
wget "XXX" -O pippo.zip
标签: php curl cookies download wget