【问题标题】:Yahoo Pipes and Website Name雅虎管道和网站名称
【发布时间】:2013-08-31 05:50:37
【问题描述】:

如何使用 Yahoo Pipes 获取页面名称?

我正在创建一个新闻/博客聚合器,并且需要知道信息来自的网站的名称(bbc、cnn、fox 等)。

我需要用 REGEX 做这个吗?

谁能帮忙?

【问题讨论】:

    标签: regex rss yahoo-pipes


    【解决方案1】:

    您可以使用 Sources 菜单中的 XPath Fetch PageFetch Feed 模块来获取页面。也许和其他人也一样。

    之后,您可以使用各种运算符(可能是 Regex 或其他运算符)提取页面名称本身,具体取决于您使用的源页面和您想要获得的输出。

    一般来说,您的问题过于宽泛,难以回答。为了帮助您入门,我创建了一个示例管道,从这篇文章中提取您的问题的标题,这基本上是当前页面的“页面名称”。

    http://pipes.yahoo.com/pipes/pipe.info?_id=668acf3f807c30d7b75f12459edd3252

    我使用带有参数的XPath Fetch Page

    • URL = 本页
    • 使用 XPath 提取 = //div[@id="question-header"]

    通过检查此页面的源代码,我得到了 div 路径,我看到 div#question-header 是问题的容器。我本可以选择更深的内部容器或更高级别的容器。这完全取决于您需要的其他信息量。您希望从页面获得的信息越多,您选择的容器级别就越高。

    接下来,我使用 Create RSS 操作符创建了一个合适的 RSS 提要,带有参数:

    • 标题 = h1.a
    • 链接 = h1.a.href

    我选择这些元素是因为在我使用 xpath 提取的容器中,页面名称在 h1 a 中。在 Yahoo Pipes 中,您使用点作为路径分隔符。

    【讨论】:

      【解决方案2】:

      我找到了这个样本管道http://pipes.yahoo.com/pipes/pipe.info?_id=69b5dce1c59501a0c64a660c1cfdb856。页面标题也包括网站名称。我不确定这是否是您要找的。​​p>

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2013-01-20
        • 1970-01-01
        • 1970-01-01
        • 2011-03-26
        • 2015-05-12
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多