如何让谷歌抓取pdf文件但不索引它们？

【问题标题】：How to let google crawl pdf files but not index them?如何让谷歌抓取pdf文件但不索引它们？
【发布时间】：2012-05-12 12:34:31
【问题描述】：

如果我理解正确，您只能通过 robots.txt 告诉 google 抓取或不抓取 pdf 文件。我希望 google 抓取文件，但不在搜索结果页面中列出它们。

这可能吗？

【问题讨论】：

好的，那么 google 会如何处理这些信息？谷歌：啊！这是一个PDF文件。很好......但是......你想让我用这个做什么？我提供搜索结果 .. 你要我不要在任何搜索结果中列出这个文件......呃.....
@Pure.Krome：如果它是付费下载资源，那么它是一个有效的举措。否则谷歌可以缓存它。
这意味着 Google 应该为 PDF 编制索引（即在结果列表中返回它），但不让 Google 缓存中的内容可用？

标签： seo robots.txt

【解决方案1】：

您可以通过 x-robots-tag http 标头将机器人指令添加到任何文件。将其设置为 noindex，按照您想要的声音进行操作。

【讨论】：

【解决方案2】：

我不确定，但这不是：<meta name="robots" content="noindex"> 是解决您问题的好方法吗？

【讨论】：

确定我的意思是指向 html 中 pdf 文件的链接。

猜你喜欢

1970-01-01
1970-01-01
1970-01-01
1970-01-01
1970-01-01
1970-01-01
2018-05-04
1970-01-01
2016-04-22

相关资源

下载 2021-06-05
下载 2023-03-29
下载 2021-06-27

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode