【问题标题】:How does Google news pull news link from different news sites?谷歌新闻如何从不同的新闻网站拉取新闻链接?
【发布时间】:2023-10-17 13:11:01
【问题描述】:

谷歌新闻如何从世界上几乎所有的报纸中提取信息。它是否单独向所有这些新闻站点发出跨域请求?据我所知,我认为跨域功能也取决于服务器配置,那么谷歌如何从一个没有为跨域请求实现任何内容的虚拟新闻网站中提取新闻。我也确信 google 没有任何用于 google news 的 API。

总的来说,谷歌新闻是如何工作的。

【问题讨论】:

    标签: javascript xml cross-domain jsonp


    【解决方案1】:

    Google 将其他站点的数据(使用在他们自己的计算机上运行的 HTTP 客户端)复制到他们自己的服务器上,然后从那里呈现出来。

    【讨论】:

    • 这不是侵犯隐私吗?可能我没听懂你的回答。
    • 没有。他们只能复制他们有权访问的信息,并且他们不提供任何特殊凭据,因此他们复制的任何信息都将是公开可用的。
    • 我可以使用这个(功能)来构建一些东西(比如一个APP)吗?
    • 定义“这个特性”。编写一个从站点获取内容并保存的 HTTP 客户端的能力?是的。许多人已经这样做了。首先浏览器供应商。
    • 只需为您选择的编程语言找到一个 HTTP 库。