【问题标题】:Facebook Crawler Issues and QuestionsFacebook 爬虫问题和问题
【发布时间】:2015-08-06 07:18:53
【问题描述】:

这篇文章包含3点:

  1. 问题:默认情况下,Facebook 爬虫从您的网站抓取新信息需要多长时间?这意味着您不会强制它使用调试器获取新的抓取信息。

  2. 问题:我遇到的问题是共享对话框显示“未找到页面”,但在抓取该页面的新信息后,它显示了正确的页面信息。

  3. 问题:我有一个页面 (http://kabayanabroad.antdomus.volenday.com/kabayan-manifesto),我在其中分配了一个 og:image 以显示在共享对话框中。当我使用 facebook 调试器时,它会显示正确的图像。但是,一旦我将其分享到 Facebook,它就会始终显示不同的图像。请看下面的图片:

来自 Facebook 调试器:

分享后来自 Facebook 时间线:

*红色的 facebook 标志也是网站的一部分,但只有 128x128 大小

【问题讨论】:

  • FB 调试工具现在显示kabayanabroad.antdomus.volenday.com 的错误。与 og:image 相关的所有元元素目前都在您的源代码中被注释掉。
  • @CBroe 是的,但有错误的链接是kabayanabroad.antdomus.volenday.com/kabayan-manifesto。我编辑了问题以包含链接。
  • 这对我来说看起来不错,在共享对话框预览中以及在 Facebook 上的最终帖子中。所以很可能只是一个缓存问题。
  • 我确认缓存问题。现在好了。 2分有答案吗?回复:#2 - 是否会自动更新带有“找不到页面”的共享帖子以显示正确的帖子标题,否则我将不得不再次共享它?
  • 至于你的问题1),developers.facebook.com/docs/sharing/opengraph/… // 已经存在的帖子不会自动更新,但你作为帖子所有者可以请求FB更新内容。您需要进入单个帖子视图(因此从您的提要/时间线中,单击帖子顶部的日期链接),有一个名为“刷新共享附件”的选项。

标签: facebook facebook-graph-api web-crawler


【解决方案1】:

在分享对话框预览以及 Facebook 上的最终帖子中,您遇到问题的 URL 对我来说看起来不错。所以很可能只是一个缓存问题。

至于您的第一个问题,抓取工具访问您网站的频率 - 请参阅 https://developers.facebook.com/docs/sharing/opengraph/using-objects#update

已经存在的帖子不会自动更新,但您作为帖子所有者可以请求 FB 更新内容。您需要进入单个帖子视图(因此从您的提要/时间线中,单击帖子顶部的日期链接),有一个名为“刷新共享附件”的选项。

【讨论】: