【问题标题】:What is a strategy to implement this URL input analysis feature?实现此 URL 输入分析功能的策略是什么?
【发布时间】:2022-01-16 19:36:41
【问题描述】:

我在 digg.com 上发现了这个很酷的功能,您可以在其中输入新闻 URL,它几乎会立即为您提供新闻故事的标题、摘要和图片。

我不需要所有这些功能,但我想只抽象出标题。

我没有资源来下载整个网站并解析它以获取此信息,但我想知道是否有办法仅获取标题...使用客户端的机器,即浏览器。

是否有可用的 API 对此有所帮助?

点击顶部的添加按钮后,可在 digg.com/news 上找到类似功能:

【问题讨论】:

  • 你不能仅仅使用浏览器 api 来获得它 - 你必须有某种后端为你处理它
  • 我不确定您所说的“浏览器 api”是什么意思……我指的是外部 API,即像谷歌​​ API 一样,它会在给定域的情况下提供网站图标。
  • 要求第三方资源是题外话
  • 我再次不确定您所说的“第 3 方”是什么意思。谁是第一方谁是第二方?我在 SO 上看到许多使用 API 的答案。
  • en.wikipedia.org/wiki/Grammatical_person — 第一方和第二方是您(提出问题)和 stackoverflow 社区(您向谁寻求答案)。第三方是其他任何人。

标签: javascript api parsing input


【解决方案1】:

我没有资源下载整个网站并说解析它以获取此信息

这将是可靠的方法。

您可以通过仅下载页面的前 ? 个字节(通过创建 range request 来提高性能,但如果 <title> 元素存在于这些字节之外,您可能会丢失它。

如果有办法只获得标题......使用客户端的机器,即浏览器。

没有。 same origin policy 可以防止这种情况发生。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-01-24
    • 2018-02-10
    • 1970-01-01
    • 1970-01-01
    • 2011-01-01
    • 1970-01-01
    相关资源
    最近更新 更多