【发布时间】:2026-02-10 00:30:01
【问题描述】:
大家好,很遗憾,我遇到了 XSLT 或 Python XML 解析器 lxml 的问题。我有一个 DTD 验证的 XML,我想使用 XSLT 来查找 ID 的所有 IDREF。下面是一个示例 XML 和 XSLT。
XML 1.0
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!DOCTYPE TEST
[
<!ELEMENT TEST (N*,SUB*)>
<!ELEMENT N (#PCDATA)>
<!ELEMENT SUB (E*)>
<!ELEMENT E (#PCDATA)>
<!ATTLIST TEST
>
<!ATTLIST SUB
>
<!ATTLIST N
Id ID #REQUIRED
X CDATA #REQUIRED
>
<!ATTLIST E
EID ID #REQUIRED
N1 IDREF #REQUIRED
N2 IDREF #REQUIRED
>
]>
<TEST>
<N Id="N1" X="0.0"/>
<N Id="N2" X="1.0"/>
<N Id="N3" X="2.0"/>
<N Id="N4" X="3.0"/>
<SUB>
<E EID="E1" N1="N1" N2="N2"/>
<E EID="E2" N1="N1" N2="N3"/>
<E EID="E3" N1="N1" N2="N4"/>
</SUB>
</TEST>
XSLT 1.0 (
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:output method="xml"/>
<xsl:strip-space elements="*"/>
<xsl:template match="//N">
<xsl:element name="NREF">
<xsl:for-each select="**idref('N1')**">
<xsl:value-of select="name()"/>
</xsl:for-each>
</xsl:element>
</xsl:template>
</xsl:stylesheet>
我的示例 python 脚本解析 XML 和 XSLT,转换 XML 并将结果写入新文件。
Python 3.9
import lxml
from lxml import etree
import xml.etree.ElementTree as ET
xml_parser = lxml.etree.XMLParser( attribute_defaults=True, dtd_validation =True, no_network=False)
xml_root = lxml.etree.parse('XML.xml', parser=xml_parser)
xslt_root = lxml.etree.parse('id_idref_test.xslt')
transform = etree.XSLT(xslt_root)
result_tree = transform(xml_root)
result_tree.write(f"XML_Result.xml",method="xml",pretty_print=True)
现在谈谈我的问题。 Xpath 支持函数id() 和idref()。当我在循环中使用id('N1') 函数时,我得到以下结果。<NREF>N</NREF>。如果我使用 idref('N1') 函数,我会从解析器中得到一个错误。 lxml.etree.XSLTApplyError: Failed to evaluate the 'select' expression.idref()函数没有在lxml范围内实现吗?
我希望我能足够详细地解释我的问题。感谢您的帮助。
【问题讨论】:
-
idref()函数需要 XPath/XSLT 2.0 或更高版本。 -
您好 michael.hor257k 先生,感谢您的快速回复。但是,Xpath 1.0 中存在 id() 函数,我看对了吗?
-
是的,
id()函数是 XPath 1.0 的一部分。但是idref()function 不是。你说你在使用idref()函数时会出错,但在使用id()函数时却没有——正如预期的那样。 -
啊,好吧。我当时就明白了。感谢您的帮助
-
我建议您使用key 机制来解决交叉引用。这适用于 XSLT 1.0,不需要 DTD。
标签: python-3.x xml xslt lxml