【问题标题】:Tool to download files (including files without direct link) from website?从网站下载文件(包括没有直接链接的文件)的工具?
【发布时间】:2017-05-23 21:40:56
【问题描述】:

我一直在尝试找到从 URL 下载文件的解决方案,例如:https://.com//。我了解了 wget 并尝试了很多选项,但意识到它不会下载任何在索引文件或任何类型中没有直接链接的文件。

例如,我想从https://somesites.com/myfolder/myfiles/ 下载所有内容。
假设“myfiles”目录下有一个 index.html,许多 html 文件和几个目录都在 index 中引用和链接,还有几个其他 html 文件,例如 sample123.html 和 sample456.html。

wget 命令成功下载了所有,但 sample123.html 和 sample456.html 几乎包含了大多数常见和众所周知的选项。

是否有任何其他工具可以抓取位于https://somesites.com/myfolder/myfiles/ 中的所有文件,无论是否有直接链接?

我还尝试了针对 http URL 的 lftp,但下载结果比 wget 的文件少得多。

我为此查看了堆栈溢出,但推荐的命令是仅下载具有直接链接(通过 wget)的文件的命令。

【问题讨论】:

    标签: wget lftp


    【解决方案1】:

    您想要做的事情是不可能的,并且可能是一个安全问题。例如,假设某人在文件夹中有一个包含一些敏感数据的文件,并且该文件未在任何地方列出。您需要一个工具来下载该文件。

    如上所述,这是不可能的,这就是为什么禁用 HTTP 服务器中的目录列表作为安全选项始终是一个好建议,以防止您想要做的事情。

    【讨论】:

    • 我明白了。我在想这可能是不可能的,但想检查是否有什么我不知道的。你说的有道理。感谢您的反馈。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-17
    • 1970-01-01
    相关资源
    最近更新 更多