【问题标题】:Changed content type leading to wrong crawls by google更改内容类型导致谷歌错误抓取
【发布时间】:2014-10-21 08:13:22
【问题描述】:

在我们基于 WordPress 构建的网站中,我们将自定义帖子类型之一的名称从“A”更改为“B”,并更改了几个类别的层次结构。

现在,问题在于 google 正在索引/抓取旧的“A”CPT 名称以及旧的类别结构,这会导致随机页面(因为 WordPress 会猜测并在 URL 中显示带有这些关键字的页面) 或 404 错误。

我们可以做些什么(通过网站管理员工具)让谷歌重新索引我们的整个网站并开始尊重我们的新结构?谢谢。

【问题讨论】:

  • 添加 301 重定向从旧帖子类型到新帖子类型,以及从旧层次结构到新层次结构。
  • 好吧,这可能是一种方式。但是,如果我们做了很多更改,而我们自己不知道我们使用的是什么类别层次结构呢?
  • 您需要手动完成。 Google 不会知道您将帖子类型 A 更改为 B。您可以让他们知道(使用 301 重定向)。

标签: wordpress url google-analytics indexing google-crawlers


【解决方案1】:

以下是 Google 索引政策的简要说明:

过程

抓取过程从网站所有者提供的过去抓取的网址列表和sitemaps 开始。当 Google 爬虫访问这些网站时,它们会寻找其他页面的链接以供访问。该软件特别关注新站点、现有站点的更改和死链接。

计算机程序确定要抓取哪些网站从每个网站抓取的频率和数量Google 不接受付款以更频繁地抓取网站以获取您的网络搜索结果。他们更关心获得尽可能好的结果,因为从长远来看,这对用户和他们的业务都是最好的。

网站所有者的选择

大多数网站不需要为抓取、索引或服务设置限制,因此他们的网页可以出现在搜索结果中,而无需做任何额外的工作。

也就是说,对于 Google 如何通过 Webmaster Tools 和一个名为“robots.txt”的文件来抓取和索引他们的网站,网站所有者有很多选择。使用robots.txt 文件,网站所有者可以选择不被Google bot 抓取,或者他们可以提供有关如何处理其网站上的页面的更具体说明。

网站所有者有精细的选择,可以选择如何逐页索引内容。例如,他们可以选择不带 sn-p(搜索结果中标题下方显示的页面摘要)或缓存版本(存储在 Google 服务器上的备用版本,以防实时页面不可用)的页面显示.站长也可以选择使用Custom Search将搜索集成到自己的页面中。

阅读更多 herehere

【讨论】:

  • 谢谢@bodi0,但我知道搜索是如何工作的。我要问的是我们可以做些什么(通过网站管理员工具),以便谷歌能够尊重我们的新结构。因为,我们已经实施了很长时间,而谷歌并没有认识到新的结构。我想知道是否可以通过“Fetch as Google”或“提交索引”或其他方式来完成任何事情。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-03-20
  • 1970-01-01
  • 2022-08-17
  • 2017-01-05
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多