【问题标题】:How to find web page details from a URL?如何从 URL 中查找网页详细信息?
【发布时间】:2015-12-02 08:11:38
【问题描述】:

我对查找网页数据的方法很感兴趣,例如标题、封面图片和一些文本,当你想通过墙上的链接分享时,Facebook 如何做。

我想过。是的,我可以向页面发送 HTTP 请求,获取所有网页并稍后解析。但是 facebook 如何为每个网页成功地做到这一点,因为并非所有网站的结构都是相同的。

从输入的网址中找到标题、封面图片和一些文字的最佳算法是什么?

【问题讨论】:

  • 可以说,Facebook 确实没有为每个网页都成功。

标签: facebook algorithm parsing url web


【解决方案1】:

没有完美的解决方案。 Facebook 使用元标记(他们设置的网站管理员)来接收正常结果。 如果标签不存在,则结果很差。 如果您关心问题的实际方面,首先您应该检查 Facebook 和其他社交网络的标签 =)

【讨论】:

    【解决方案2】:

    查看以下脚本。他们使用元标签从网站收集数据。 http://www.techumber.com/2012/11/exactly-facebook-like-url-parsing-using.html

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-11-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-06-29
      相关资源
      最近更新 更多