【问题标题】:How to get real filename from wget如何从 wget 获取真实的文件名
【发布时间】:2012-10-31 20:28:29
【问题描述】:

我正在编写一个 bash 脚本并使用 wget 从网站检索一些 PDF 文件。例如:

wget www.barb.co.uk/news/item-subscriber/id/213/index.html

但是 wget 将文件保存为 index.html。如果我在浏览器中输入该 URL,它会正确下载具有真实名称的文件 - “BARB Bulletin 25 - December 10.pdf”。

我怎样才能让 wget 做同样的事情?还是有其他方法可以找到文件的真实名称(从 bash 脚本中)?

【问题讨论】:

    标签: bash filenames wget


    【解决方案1】:

    您可以使用--content-disposition 选项让 wget 更复杂地查看 HTTP 响应的标头,这在大多数情况下都有帮助。

    例子:

    wget --content-disposition www.barb.co.uk/news/item-subscriber/id/213/index.html
    

    【讨论】:

    • 您可以通过将content_disposition=on 添加到~/.wgetrc 文件来将其设为默认值。
    【解决方案2】:

    看看 wgets --content-disposition 选项。

    【讨论】:

    • 虽然此链接可能会回答问题,但最好在此处包含答案的基本部分并提供链接以供参考。如果链接页面发生更改,仅链接的答案可能会失效。
    • 是的,感谢您的宝贵意见。这当然有很大帮助。特别是因为答案中没有链接......
    • 喜欢讽刺,但这是 SO 提供的脚本答案。如果您想要详细信息,我的意思是您只是引用了一个项目,而没有帮助解释它如何使用或为什么它会成为解决方案。 hoeni 这样做了,你错过了。
    • 要解释什么?您将开关添加到wget 命令。完成。
    猜你喜欢
    • 2017-03-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-08-08
    • 2011-09-21
    • 1970-01-01
    • 2015-08-02
    相关资源
    最近更新 更多