【问题标题】:URLs: Files and Directories with the same name?URL:同名的文件和目录?
【发布时间】:2011-08-13 23:45:31
【问题描述】:

在 URL 方案中,如果目录和文件具有相同的名称,是否有任何不利之处?

我提供一个例子来说明我的意思:

假设您要进行分页。你可以这样做:

http://example.com/watches/page1
http://example.com/watches/page2
http://example.com/watches/page3
http://example.com/watches/page4

您可以将其解释为:有一个目录“watches”,其中包含 4 个文件——“page1”到“page4”。

现在,可能会经常访问第一页,因此缩短指向它的链接是有意义的:

http://example.com/watches
http://example.com/watches/page2
http://example.com/watches/page3
http://example.com/watches/page4

第一个链接仍将显示第 1 页,但“page1”已关闭。它不会重定向到

http://example.com/watches/page1

因为这会迫使服务器再次往返。

您可以将其解释为:有一个名为“watches”的文件(显示手表类别中的第一页),并且有一个目录 'watches' 有 3 个文件 - 'page2' 到 'page4'。

这又是我的问题:如果目录和文件具有相同的名称,如上例中的“watches”,是否有任何不利之处?

以下是我的想法:

就 SEO 而言,它可能不是不利的,因为 AFAIK 搜索引擎没有目录的概念,因此将 URL 视为字符块。只要 URL 不同(在我的示例中就是这样),搜索引擎就不会打扰。

如果有人想用 wget 之类的网络爬虫来归档我的网站并将其内容镜像到本地硬盘上,这可能是个问题,因为大多数文件系统不允许超过一个文件/目录具有相同的名称。但是,恕我直言,这很容易解决,例如通过使用 wget 的 -E 选项,它将 .html 扩展名添加到 HTML 文件,而不是目录。

除此之外,我认为没有任何问题。你呢?

【问题讨论】:

  • 在什么文件系统中文件和目录可以同名?无论如何——在 URI 中没有文件/目录,只有资源。正如所指出的,必须添加任何额外的含义。 (让我对整个问题感到困惑 ;-)

标签: url seo directory pagination web-crawler


【解决方案1】:

现在的 Web 服务器基本上不会将 URI 作为目录和文件来读取,而是将其作为资源的地址来读取,而且在大多数情况下,URI 和资源之间的路由很复杂。以这个问题为例,它不是目录中的 HTML 文件。因此,网络爬虫也不必处理不能用作文件名的结构。

我不太确定你的问题是什么,但我希望这会有所帮助。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2014-02-02
    • 2012-06-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-09-16
    • 1970-01-01
    相关资源
    最近更新 更多