【问题标题】:How to get news from another website via RSS如何通过 RSS 从另一个网站获取新闻
【发布时间】:2013-02-23 19:38:44
【问题描述】:

我有一个博客,我想要一些自动生成的新闻。我找到了一些生成 RSS 提要的新闻网站,我想将它们自动发布到我的博客上。 我使用 WP-o-Matic 插件完成了这项工作,但由于 RSS 提要的内容仅限于某个点,整个新闻的文本不会显示在我的博客上。

有没有办法获取 RSS 提要链接到的帖子的全部内容?

【问题讨论】:

    标签: wordpress rss


    【解决方案1】:

    您将不得不自己编写代码。假设您订阅了 Google 新闻的 RSS 提要。您可以解析他们的提要以获取摘要文章的原始 URL,但随后您将不得不向该 URL 发出请求并获取该页面上的内容。除非来源碰巧通过自己的 RSS 提要提供整篇文章(不太可能),否则您可能处于标记抓取领域。

    必须这样说:考虑在您的网站上复制整个原始内容(而不是摘要 sn-ps)的道德/法律影响,即使有适当的归属。

    【讨论】:

      【解决方案2】:

      对于需要解决我描述的问题的人.. 有如下服务:

      http://fulltextrssfeed.com/

      http://fullrss.net/

      http://www.wizardrss.com/

      您可以使用它们为您完成工作。他们获取 RSS 提要、抓取网站并为您提取完整的文章。之后,他们用提取的数据提供自己的 RSS 提要。 您可以将提取的数据(服务为您提供的 RSS 提要)与 WP-o-Matic 之类的 wordpress 插件相结合。这样,插件连接到服务的 RSS 提要,服务从原始 RSS 提要中提取内容。

      请记住,这些服务并不完美。由于复杂的网站布局,这些服务可能无法找到内容,或包含不属于文章的内容。建议手动检查输出。

      【讨论】:

      • 仅供参考,我还检查了这些服务,有很多原因我不会在生产应用程序中使用它们。最大的问题是,就像我上面的回答所述:他们只是为您提供屏幕抓取的数据、标记标签和所有内容(这对以后的格式化不利)。试试看:访问 arstechnica.com 文章,然后在“完整 RSS”提要中打开同一篇文章。如果您对内容进行比较,您会看到它只是页面中的 html。另一个大问题是您没有针对他们的提要的 SLA,因此他们可能随时关闭,恕不另行通知。
      【解决方案3】:

      对于顶部列出的服务,您还可以查看 http://www.FeedsAPI.org ,FeedsAPI 提供了将文章直接发布到您的秘密博客电子邮件的过程,因此,您需要做的就是在 wordpress 管理员中管理出版物,您还可以让它针对特定的提要来接收您想要的结果。另一种选择是这些服务之一与 IFTTT 的组合。我希望这会有所帮助。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2018-05-03
        • 2017-11-06
        • 2016-10-10
        • 1970-01-01
        • 2011-02-14
        • 1970-01-01
        • 2014-03-11
        相关资源
        最近更新 更多