【问题标题】:How to let google crawl pdf files but not index them?如何让谷歌抓取pdf文件但不索引它们?
【发布时间】:2012-05-12 12:34:31
【问题描述】:

如果我理解正确,您只能通过 robots.txt 告诉 google 抓取或不抓取 pdf 文件。我希望 google 抓取文件,但不在搜索结果页面中列出它们。

这可能吗?

【问题讨论】:

  • 好的,那么 google 会如何处理这些信息?谷歌:啊!这是一个PDF文件。很好......但是......你想让我用这个做什么?我提供搜索结果 .. 你要我不要在任何搜索结果中列出这个文件......呃.....
  • @Pure.Krome:如果它是付费下载资源,那么它是一个有效的举措。否则谷歌可以缓存它。
  • 这意味着 Google 应该为 PDF 编制索引(即在结果列表中返回它),但不让 Google 缓存中的内容可用?

标签: seo robots.txt


【解决方案1】:

您可以通过 x-robots-tag http 标头将机器人指令添加到任何文件。将其设置为 noindex,按照您想要的声音进行操作。

【讨论】:

    【解决方案2】:

    我不确定,但这不是:<meta name="robots" content="noindex"> 是解决您问题的好方法吗?

    【讨论】:

    • 确定我的意思是指向 html 中 pdf 文件的链接。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-05-04
    • 1970-01-01
    • 2016-04-22
    相关资源
    最近更新 更多