【问题标题】:Disallow subdirectory in robots.txt with language code禁止 robots.txt 中带有语言代码的子目录
【发布时间】:2013-09-04 07:21:05
【问题描述】:

我们的网站被翻译成大约 15 种语言,我们的编辑会定期提供更多语言。

我们的网址是这样建立的:

SiteName.Company.com/{LCID}/Folder1/Folder2/

我们公司希望对搜索引擎隐藏子文件夹/页面。

LCID 可以是从 EN-US 到 ZH-HANS 的任何内容。我正在寻找一种解决方案,我们不必在每次添加新语言时都更新机器人文件。

我可以创建一个通配符条目或过滤掉单个文件夹名称而不管它的路径吗?

IE:companyinfo.no​​kia.com/en-us/aboutus/darknews/ 我希望 Google 抓取除 darknews 和 down 之外的所有内容(因此 /darknews/ELOPSellsOut 或 /darknews/3210revival)

这可能吗?

【问题讨论】:

  • lcid 是正确的术语吗?它说这是一个“数字 ID”。
  • 在这种情况下没关系,但不,你的权利。 LCID 是一个数字。我的意思是文化信息缩写。

标签: robots.txt subdirectory lcid


【解决方案1】:

您可以使用通配符来做到这一点:

User-agent: *
Disallow: /*/darknews/

请注意,并非所有机器人都支持通配符。这适用于 Googlebot 和 Bingbot,但不适用于许多其他人。

【讨论】:

    猜你喜欢
    • 2011-04-07
    • 1970-01-01
    • 2023-03-31
    • 2015-03-22
    • 2013-04-10
    • 2016-09-23
    • 1970-01-01
    • 2013-01-14
    • 2011-06-17
    相关资源
    最近更新 更多