【发布时间】:2012-06-03 12:45:41
【问题描述】:
我一直在处理这个页面 http://www.btselem.org/hebrew/131606
我决定添加 Facebook 分享按钮,但出于某种原因,每当我尝试分享时,Facebook 抓取工具都无法获取源中的任何元标记——它只显示网站的 URL。 在facebook开发者调试工具中查看URL后,得到206响应码和如下错误:
无法下载 - 无法检索数据表单 URL。
我还检查了“查看我们的抓取工具从您的 URL 中看到的确切内容”选项,似乎抓取工具只能读出以下行:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
奇怪的是,这甚至不是我在页面源中获得的 DOCTYPE。 我已经尝试将 DOCTYPE 更改为:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">
在我阅读了一些较早的帖子后说这应该可以解决问题,但这也不起作用 - 我继续从刮板中获得相同的线路。 如果你们有任何提示或想法,我将不胜感激……
我发布了源代码的第一部分,至少包含元标记的部分。如有必要,我将添加整个代码。 提前致谢,
大卫。
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-Transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:fb="http://www.facebook.com/2008/fbml" xmlns:og="http://opengraphprotocol.org/schema/" xml:lang="he" lang="he" dir="rtl">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>לקסיקון הכיבוש: 67 שניות על... מאחז |בצלם</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta property="fb:app_id" content="142675212478057"/>
<link rel="shortcut icon" href="/sites/all/themes/btselem/images/favicon.ico" type="image/x-icon" />
<meta property="og:site_name" content="בצלם" />
<meta property="og:title" content="מאחז | בצלם" />
<meta property="og:type" content="article" />
<meta property="og:url" content="http://www.btselem.org/hebrew/131606" />
<link type="text/css" rel="stylesheet" media="all" href="/sites/default/files2/css/css_1458508373fb743060ffb80b43b3d59c.css" />
<link type="text/css" rel="stylesheet" media="print" href="/sites/default/files2/css/css_ff9c22380c0853814b0563da89e16090.css" />
【问题讨论】:
-
使用debugger 我发现你的大部分页面都可以正常工作,调试器抱怨的是格式为“/hebrew/NUMBER”的页面。如果您将这些页面的 html 输出与其他页面进行比较,您会发现确实存在一些不同,因为它们具有不同的 doctype 定义。试着找出页面为什么会发生变化,然后也许你会发现为什么这个变化不被 facebook 喜欢。
-
感谢您的快速回复!更改 DOCTYPE 后,问题仍然存在 - 仍然从刮板获得那个奇怪的 DOCTYPE。所以我猜这不是 DOCTYPE,或者至少不是单独的 DOCTYPE。知道还有什么可能导致这个问题吗?再次感谢!
标签: facebook share doctype meta-tags scraper