【发布时间】:2015-07-08 20:20:04
【问题描述】:
我收到一个必须允许具有文档类型声明 (DTD) 的 XML 文档,但我们禁止任何实体声明。
用SAXParser.parse()解析XML文档,如下:
SAXParserFactory factory = SAXParserFactory.newInstance();
factory.setFeature("http://xml.org/sax/features/external-general-entities", false);
factory.setFeature("http://xml.org/sax/features/external-parameter-entities", false);
factory.setValidating(true);
SAXParser parser = factory.newSAXParser();
XML 然后作为InputSource 传递到解析器:
InputSource inputSource= ... ;
parser.parse(inputSource, handler);
而handler 有一个resolveEntity 方法,SAXParser.parse() 调用:
public InputSource resolveEntity(String pubID, String sysID) throws SAXException {
InputSource inputSource = null;
try {
inputSource = entityResolver.resolveEntity(publicId, systemId);
}
catch (IOException e) {
throw new SAXException(e);
}
return inputSource;
}
当我传入一个带有 ENTITY 引用的 XML 文件时,似乎什么都没做 - 没有抛出异常,也没有任何内容被剥离 - 或关于被禁止的 ENTITY 引用。
这是我正在使用的错误 XML 的示例。应该允许 DTD,但不允许使用 !ENTITY 行:
<!DOCTYPE foo SYSTEM "foo.dtd" [
<!ENTITY gotcha SYSTEM "file:///gotcha.txt"> <!-- This is disallowed-->
]>
<label>&gotcha;</label>
我需要做些什么来确保在 XML 中不允许 ENTITY 引用,但仍然允许 DTD?
【问题讨论】: