【问题标题】:Wildcard on wget to http download last release versionwget 上的通配符到 http 下载最新版本
【发布时间】:2016-04-04 19:01:29
【问题描述】:

想象一下(就像约翰列侬那样)我正在编写一个脚本来下载,比如说,KeePassTrueCrypt 插件的最新版本。

仅仅因为 URL 包含版本号而不是简单的“上一个版本”或 PPA 来更新上一个版本是很痛苦的,所以我使用了通配符。这是我的尝试:

wget -r --no-parent -A "KeepassTrueCryptMount_v**.plgx.7z" https://bitbucket.org/schalpat/keepasstruecryptmount/downloads/

但是1)它只下载index.html和robots.txt而不是文件2)没有指定下载最后一个版本(max函数?)。

感谢您的帮助。干杯,

【问题讨论】:

    标签: http download version wildcard wget


    【解决方案1】:

    您尝试下载的文件托管在另一个名为 amazonaws.com 的域中。 因此,您可以尝试这些选项从其他域下载。因为Wget 的递归检索通常会拒绝访问与您在命令行中指定的主机不同的主机。

    -H'-H' 选项打开主机跨接,从而允许 Wget 的递归运行访问链接引用的任何主机。

    -D “-D”选项允许您指定将遵循的域,从而将递归限制为仅属于属于的主机 这些域。显然,这只有与 ‘-H’

    【讨论】:

    • 我真的以为它是托管在 bitbucket 上的。尽管如此,我还是尝试了wget -r -l1 --no-parent -A.plgx.7z -H https://bitbucket.org/schalpat/keepasstruecryptmount/downloads/ -D amazonaws.com
    • 并且只下载 index.html。如果没有 -D,从逻辑上讲,每个链接都会被下载。
    • 您可以通过使用其他选项使 wget 更加逼真。比如referer、cookies、useragent等等……
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-02-21
    • 1970-01-01
    • 1970-01-01
    • 2012-11-13
    • 1970-01-01
    相关资源
    最近更新 更多