【问题标题】:How to set up the HTTP Client to Get XML steps in Pentaho Kettle PDI如何在 Pentaho Kettle PDI 中设置 HTTP 客户端以获取 XML 步骤
【发布时间】:2012-11-26 13:53:56
【问题描述】:

我想找到一种使用 Kettle PDI 4.2.3 将 Twitter 搜索结果转换为可处理格式的详细方法。

到目前为止,我有以下步骤:

第 1 步:生成行 在第一行我插入链接 Twitter Search Results

限制=1

第 2 步:HTTP 客户端 在这里我进行了设置,因此我接受了上一个字段中的 URL。在输出字段中,我编写了 job-xml。在字段选项卡中,我不知道该怎么做。如果我按下获取字段,它将给我生成行中的单个字段。但我把它留空。

第 3 步:获取 XML 数据 这是我遇到问题的地方。目前的情况是: - 在“文件”选项卡中,我检查了从字段中获取 Xml 并编写了“job-xml”。我把剩下的留空 - 在“内容”选项卡中“命名空间感知”和“如果没有检查任何文件,则不要引发错误”。 Loop XPath 是空的。如果我按 Get XPath Nodes,它会显示“请提供 XML 片段”。通常它应该给我节点选项。如果我用包含 xml 代码的文本文件输入替换 HTTP 客户端,我将获得节点的选项。 - 在“字段”选项卡中,我当然无法获取字段,因为它需要我指定 XPath

所以我被困在这里。通常我想从 HTTP 客户端获取 Tweeter 字段,然后继续执行下一步,例如选择值和 Excel 输出。

如果有人能找出我做错了什么并且可以帮助我将推文转化为 excel,我将永远感激不尽:)

提前谢谢你

【问题讨论】:

    标签: xml pentaho tweets kettle


    【解决方案1】:

    最好的办法是将 twitter xml 写入一个文件,然后您可以将该文件用于您的 XML 片段。这有点傻,但是只有当你从文件中读取 xml 时,你可以选择节点等的 get xml 东西才有效。

    所以设置 Xpath 和文件中的所有内容,测试它,一旦它工作切换回 xml 在一个字段中。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2023-03-11
      • 2014-06-18
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多