【问题标题】:Facebook struggles to scrape one domainFacebook 努力抓取一个域名
【发布时间】:2012-07-07 11:02:41
【问题描述】:

我已经查看了这个question,听起来他描述的问题和我完全一样,除了几件事:

  1. 我没有在 https 上运行
  2. 80% 的时间我尝试调试,我收到此消息“解析输入 URL 时出错,没有数据被抓取。”
  3. 刮板可以在不同的域、相同的服务器、相同的主题和几乎相同的内容上完美运行。每次我尝试一个域时,它都会完美地抓取它,包括图像

在它实际抓取我的页面的 20% 期间,我在上面的链接中遇到了同样的问题。它正在阅读我的缩略图,但显示的是空白图像。该链接将我带到工作图像,但它不想显示任何内容。

奇怪的是,大约 10 个月前,当我每天更新这个博客时,它运行得非常好。唯一的区别是我最近切换了服务器。虽然这可以解释一种可能性,但另一个域也切换了并且没有这个问题。

我不知道为什么我的链接要么在 facebook 中根本没有显示图像,要么给我:

域链接 领域 (没有图片,没有描述)

非常令人沮丧的情况。有人有什么建议吗?

更新:

我有 6 个域...

当我最近移动服务器时,我发现新服务器没有准备好压缩页面,所以我的博客文章看起来很疯狂。这迫使我在我的主博客上关闭 WP Super Cache 的压缩。我也在我的第二高流量博客上做了这件事,我想稍后再去其他 4 个。

好吧,现在前两个博客在 facebook 调试器中似乎可以正常工作,但其余 4 个则有问题。棘手的部分是,我从一个站点完全删除了 WP Super Cache,但仍然无法获取数据。

因此,虽然从逻辑上看它应该是一个 WP Super Cache 问题,但尽管将其删除,但仍然存在错误让我现在相信?我还是很迷茫。

更新: 好的,我加载了 Chrome 和 IE,两者都能够轻松提取数据。 google sn-p 工具也很好用。我将尝试通过 chrome 发布我的 facebook 粉丝页面的链接,看看它是否正常工作。

我确实清除了我的 FF 缓存并且它没有改变,但我仍然很困惑为什么一个域可以正常工作而另一个域不能正常工作。无论哪种方式,如果添加 Chrome 有效,我现在会坚持下去。

还有其他建议吗?

【问题讨论】:

    标签: facebook facebook-graph-api facebook-opengraph


    【解决方案1】:
    1. 缓存不应该有任何问题。如果浏览器可以看到您的页面,那么 facebook 调试器也可以。

    2. 查看是否存在一些 500 错误。从不同的浏览器尝试,清除浏览器缓存等。尝试google rich snippet,看看自定义搜索引擎是否可以正常报废。

    PS: 发个网址就更好了。

    【讨论】:

    • 对不起,我应该列出一些链接...使用 Firefox,我可以从任何这个域 teenmomjunkies.com 的任何链接中进行调试,它工作正常。但是,每当我从 bigbbrotherjunkies.com 发布博客文章时,我要么得到 a) 错误,b) 解析 URL 时出错,要么 c) 最终填写但未显示图像。谢谢你的帮助。晚饭后我会看看你的其他建议
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-05
    相关资源
    最近更新 更多