【发布时间】:2013-07-02 15:18:14
【问题描述】:
我有以下情况:
<xml>Text text text<a><b></b>Test text</a> text text text<c>text text</c><d><d/><xml>
如何解析这个 xml 以便保留所有信息(解析成树?)。我需要保留文本以及文本中标签的顺序和位置。
感谢您的帮助!
编辑:我已经尝试过使用 java 解析器...我没有设法让它工作。
【问题讨论】:
-
到目前为止...你做了什么?
-
google.com -> java parse xml On of the first results给了我这个mkyong.com/java/how-to-read-xml-file-in-java-sax-parser
-
@Adriano :我尝试使用 dom4j 解析器...使用 xpath 可以从标签中获取文本...但随后我丢失了所有其他信息
-
第一:你想在哪里以及如何存储它们?如果您需要将该数据保存在树中......只需将其保存为它们的格式并通过 DOM 访问它们。第二:它不是有效的 XML(未封闭的标签),但我想这只是你在这里写的一个例子。最后:向我们展示您的代码并更具体(参见常见问题解答)否则我们必须猜测您可能需要什么。
-
@Adriano:我需要将信息存储到数据库中(然后可以更改一些信息:例如部分文本或标签的顺序)。之后,我必须再次使用代表新信息的 xml 结构创建一个文本文件。标签表示文本的格式(粗体,斜体,字体样式,还有更复杂的东西)..但就像你说的:xml 格式不正确或事件无效(第二个
标签实际上应该是 标签)...所以没有未闭合的标签。