【问题标题】:Comma separated string parsing XSLT to for-each node逗号分隔的字符串将 XSLT 解析为 for-each 节点
【发布时间】:2012-01-20 00:02:13
【问题描述】:

我有一个包含 csv 值的输入字符串。例如,1,2,3 我需要在 for-each 循环中分离每个值并分配给目标节点。

我在下面得到了这个模板,它根据分隔符分割输入字符串。如何将每个分隔值分配给 for-each 循环中的目标元素。

<xsl:template name="output-tokens">
<xsl:param name="list"/>
<xsl:param name="delimiter"/>
<xsl:variable name="newlist">
  <xsl:choose>
    <xsl:when test="contains($list, $delimiter)">
      <xsl:value-of select="normalize-space($list)"/>
    </xsl:when>
    <xsl:otherwise>
      <xsl:value-of select="concat(normalize-space($list), $delimiter)"/>
    </xsl:otherwise>
  </xsl:choose>
</xsl:variable>
<xsl:variable name="first" select="substring-before($newlist, $delimiter)"/>
<xsl:variable name="remaining"
              select="substring-after($newlist, $delimiter)"/>
<xsl:variable name="count" select="position()"/>
<num>
  <xsl:value-of select="$first"/>
</num>
<xsl:if test="$remaining">
  <xsl:call-template name="output-tokens">
    <xsl:with-param name="list" select="$remaining"/>
    <xsl:with-param name="delimiter">
      <xsl:value-of select="$delimiter"/>
    </xsl:with-param>
  </xsl:call-template>
</xsl:if>
</xsl:template>

输入xml:

<out1:AvailableDates>
<out1:AvailableDate>15/12/2011,16/12/2011,19/12/2011,20/12/2011,21/12/2011</out1:AvailableDate>
</out1:AvailableDates>

预期输出:

<tns:AvailableDates>
<tns:AvailableDate>15/12/2011</tns:AvailableDate>
<tns:AvailableDate>16/12/2011</tns:AvailableDate>
<tns:AvailableDate>120/12/2011</tns:AvailableDate>
</tns:AvailableDates>

【问题讨论】:

    标签: xslt


    【解决方案1】:

    这是一个完整、简短、真正的 XSLT 1.0 解决方案

    <xsl:stylesheet version="1.0"
     xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
     xmlns:out1="undefined" xmlns:tns="tns:tns"
      exclude-result-prefixes="out1 tns">
     <xsl:output omit-xml-declaration="yes" indent="yes"/>
     <xsl:strip-space elements="*"/>
    
     <xsl:template match="out1:AvailableDate">
      <tns:AvailableDates>
        <xsl:apply-templates/>
      </tns:AvailableDates>
     </xsl:template>
    
     <xsl:template match="text()" name="split">
      <xsl:param name="pText" select="."/>
      <xsl:param name="pItemElementName" select="'tns:AvailableDate'"/>
      <xsl:param name="pItemElementNamespace" select="'tns:tns'"/>
    
        <xsl:if test="string-length($pText) > 0">
         <xsl:variable name="vNextItem" select=
          "substring-before(concat($pText, ','), ',')"/>
    
          <xsl:element name="{$pItemElementName}"
                       namespace="{$pItemElementNamespace}">
           <xsl:value-of select="$vNextItem"/>
          </xsl:element>
    
          <xsl:call-template name="split">
            <xsl:with-param name="pText" select=
                           "substring-after($pText, ',')"/>
            <xsl:with-param name="pItemElementName" select="$pItemElementName"/>
            <xsl:with-param name="pItemElementNamespace" select="$pItemElementNamespace"/>
          </xsl:call-template>
        </xsl:if>
     </xsl:template>
    </xsl:stylesheet>
    

    应用于所提供的 XML 文档时(更正为格式正确):

    <out1:AvailableDates xmlns:out1="undefined">
        <out1:AvailableDate>15/12/2011,16/12/2011,19/12/2011,20/12/2011,21/12/2011</out1:AvailableDate>
    </out1:AvailableDates>
    

    产生想要的正确结果

    <tns:AvailableDates xmlns:tns="tns:tns">
       <tns:AvailableDate>15/12/2011</tns:AvailableDate>
       <tns:AvailableDate>16/12/2011</tns:AvailableDate>
       <tns:AvailableDate>19/12/2011</tns:AvailableDate>
       <tns:AvailableDate>20/12/2011</tns:AvailableDate>
       <tns:AvailableDate>21/12/2011</tns:AvailableDate>
    </tns:AvailableDates>
    

    【讨论】:

    • 非常感谢。优秀
    • @Arun:我很高兴我的回答很有用。能否请您将答案标记为已接受(单击答案旁边的复选标记)?这是 SO 官方确立的表达感谢的方式。
    • 绝对是。在我的 XSL 中,我收到消息:
    • @Arun:这条消息意味着在您的xsl:template 指令中,您使用了matchname 以外的属性。找出您使用过的其他属性并将其删除。
    【解决方案2】:

    使用 XSLT 2.0,您可以使用 tokenize(string, separator) 函数代替命名模板。

    还有这个 xsl:

    <xsl:stylesheet version="2.0" 
        xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
        xmlns:tns="http://tnsnamespace">
    
        <xsl:template match="AvailableDate">
            <tns:AvailableDates>
                <xsl:for-each select="tokenize(current(), ',')">
                    <tns:AvailableDate>
                        <xsl:value-of select="."/>
                    </tns:AvailableDate>
                </xsl:for-each>
            </tns:AvailableDates>
        </xsl:template>
    </xsl:stylesheet>
    

    给出以下结果:

    <?xml version="1.0" encoding="UTF-8"?>
    <tns:AvailableDates xmlns:tns="http://tnsnamespace">
        <tns:AvailableDate>15/12/2011</tns:AvailableDate>
        <tns:AvailableDate>16/12/2011</tns:AvailableDate>
        <tns:AvailableDate>19/12/2011</tns:AvailableDate>
        <tns:AvailableDate>20/12/2011</tns:AvailableDate>
        <tns:AvailableDate>21/12/2011</tns:AvailableDate>
    </tns:AvailableDates>
    

    更新

    在向后兼容模式下使用 Xslt 2.0 处理器,以下模板给出相同的结果:

    <xsl:template match="AvailableDate">
        <tns:AvailableDates>
            <xsl:variable name="myValue">
                <xsl:call-template name="output-tokens">
                    <xsl:with-param name="list" select="."/>
                    <xsl:with-param name="delimiter" select="','"/>
                </xsl:call-template>
            </xsl:variable>
    
            <xsl:for-each select="$myValue/node()">
                <tns:AvailableDate>
                    <xsl:value-of select="."/>
                </tns:AvailableDate>
            </xsl:for-each>
        </tns:AvailableDates>
    </xsl:template>
    

    对于 Xslt 1.0 - 不可能通过变量简单(使用标准函数)访问节点 - 请参阅 @Dimitre Novatchev 回答 XSLT 1.0 - Create node set and pass as a parameter

    为此,XSLT 1.0 处理器包含扩展函数:node-set(...)

    对于 Saxon 6.5,node-set() 函数在 @987654322@ 命名空间中定义

    所以对于 XSLT 1.0 处理器的解决方案是:

    <xsl:stylesheet version="1.0"
        xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
        xmlns:exslt="http://exslt.org/common"
        xmlns:out1="http://out1namespace"
        xmlns:tns="http://tnsnamespace"
        exclude-result-prefixes="out1 exslt">
        <xsl:output omit-xml-declaration="yes" indent="yes"/>
        <xsl:strip-space elements="*"/>
    
        <xsl:template match="out1:AvailableDate">
            <tns:AvailableDates>
                <xsl:variable name="myValue">
                    <xsl:call-template name="output-tokens">
                        <xsl:with-param name="list" select="."/>
                        <xsl:with-param name="delimiter" select="','"/>
                    </xsl:call-template>
                </xsl:variable>
                <xsl:for-each select="exslt:node-set($myValue)/node()">
                    <tns:AvailableDate>
                        <xsl:value-of select="."/>
                    </tns:AvailableDate>
                </xsl:for-each>
            </tns:AvailableDates>
        </xsl:template>
    
        <xsl:template name="output-tokens">
            <xsl:param name="list"/>
            <xsl:param name="delimiter"/>
            <xsl:variable name="newlist">
                <xsl:choose>
                    <xsl:when test="contains($list, $delimiter)">
                        <xsl:value-of select="normalize-space($list)"/>
                    </xsl:when>
                    <xsl:otherwise>
                        <xsl:value-of select="concat(normalize-space($list), $delimiter)"/>
                    </xsl:otherwise>
                </xsl:choose>
            </xsl:variable>
            <xsl:variable name="first" select="substring-before($newlist, $delimiter)"/>
            <xsl:variable name="remaining"
                select="substring-after($newlist, $delimiter)"/>
            <xsl:variable name="count" select="position()"/>
            <num>
                <xsl:value-of select="$first"/>
            </num>
            <xsl:if test="$remaining">
                <xsl:call-template name="output-tokens">
                    <xsl:with-param name="list" select="$remaining"/>
                    <xsl:with-param name="delimiter">
                        <xsl:value-of select="$delimiter"/>
                    </xsl:with-param>
                </xsl:call-template>
            </xsl:if>
        </xsl:template>
    
    </xsl:stylesheet>
    

    感谢@Dimitre Novatchev 纠正我和他关于从变量访问节点集的回答。

    【讨论】:

    • 非常感谢。我正在使用 BPEL 10g。它具有 xslt 1.0 版。它有什么可能?
    • 我已经更新了我对 Xslt-1.0 的回答——它使用了你的 output-tokens 命名模板
    • @Vitaliy:请务必使用任何 XSLT 1.0(兼容)处理器运行您的 XSLT 1.0 解决方案,并查看这会产生错误。在 XSLT 1.0 中,RTF(结果树片段)上允许的操作集非常有限。请正确。
    • @Dimitre Novatchev - 是的,我发现它不适用于 Saxon 6.5.5(仅在我添加 version="1.1" 时有效),但在向后兼容模式下适用于 Saxon 9.3。
    • @Dimitre Novatchev - 使用 node-set() 扩展函数修复
    【解决方案3】:

    就个人而言,我更喜欢这种基于自定义扩展功能的变体。该方法简洁明了,并且在 XSLT 1.0 中运行良好(至少在 XALAN 2.7 中嵌入在任何最近的 JVM 中)。

    1) 使用返回 org.w3c.dom.Node 的静态方法声明一个类

    package com.reverseXSL.util;
    
    import org.w3c.dom.*;
    import java.util.regex.*;
    import javax.xml.parsers.DocumentBuilderFactory;
    
    public class XslTools {
    
      public static Node splitToNodes(String input, String regex) throws Exception {
        Document doc = DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
        Element item, list = doc.createElement("List");
        Pattern p = Pattern.compile(regex);
        Matcher m = p.matcher(input);
        while (m.find()) {
          item = doc.createElement("Item");
          StringBuffer sb = new StringBuffer();
          for (int i=1; i<=m.groupCount(); ++i) if (m.start(i)>=0) sb.append(m.group(i));
          Text txt = doc.createTextNode(sb.toString());
          item.appendChild(txt);
          list.appendChild(item);
        }
        return list; 
      }
    
    }
    

    此函数将输入字符串拆分为正则表达式模式并创建类型为 ABC 的文档片段列表>。 正则表达式按顺序匹配,每个匹配产生一个 Item 元素,其值由每个正则表达式匹配中的捕获组(有些可能为空)组成。这允许摆脱分隔符和其他语法字符。

    例如,要拆分像" A, B ,, C" 这样的逗号分隔列表,跳过空值并修剪多余的空格(因此得到上面的节点列表),请使用像'\s*([^,]+?)\s*(?:,|$)' 这样的正则表达式 - 一个头脑扭曲!相反,如果您想将输入文本按固定大小(此处为 10 个字符)拆分,最后一个项目取剩余的任何内容,请使用像 '(.{10}|.+)' 这样的正则表达式 - 喜欢它!

    然后您可以按如下方式使用 XSLT 1.0 中的函数(非常紧凑!):

    <xsl:stylesheet version="1.0" xmlns:var="com.reverseXSL.util.XslTools" extension-element-prefixes="var" ...
    ...
    <xsl:template ...
      ...
      <xsl:for-each select="var:splitToNodes(Detail/CsvText,'\s*([^,]+?)\s*(?:,|$)')/Item">
        <Loop><xsl:value-of select="."/></Loop>
      </xsl:for-each>
    ...
    

    在模板匹配上执行,生成输入片段&lt;Detail&gt;&lt;CsvText&gt;a, b ,c &lt;/CsvText&gt;&lt;/Detail&gt;,您将生成&lt;Loop&gt;a&lt;/Loop&gt;&lt;Loop&gt;b&lt;/Loop&gt;&lt;Loop&gt;c&lt;/Loop&gt;

    诀窍是不要忘记遵循通过 XPath“/Item”(或“/*”)生成 Node/Item 的函数调用,正如您应该注意的那样,以便将 Node 序列返回到 for-each循环。

    【讨论】:

    • 如果您正在使用 Xalan,那么您可以使用 Xalan 支持的 EXSLT str:tokenize() 扩展功能,而不必自己编写。但 XSLT 1.0 并不一定意味着您使用的是 Xalan 或 Java。
    猜你喜欢
    • 2011-02-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-12-04
    • 2021-11-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多