【问题标题】:DOM parser for non xml非 xml 的 DOM 解析器
【发布时间】:2010-11-24 02:26:15
【问题描述】:

我想解析以下类型的文本。示例 1 <root>my name is <j> <b> mike</b> </j> </root>

示例 2

<root> my name is   <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root>

我可以使用 DOM 解析器来解析它吗?我不会每次都有相同的格式。我可以有不同的标签嵌套格式。我事先不知道格式。

【问题讨论】:

    标签: java xml dom parsing


    【解决方案1】:

    这两个示例都是有效的 XML 文档,因此您没有理由不能这样做。

    如果您的 XML 非常简单,尤其是当它结合了文本和标签时,您可能希望首先通过 XSL transformation 运行它,以获得更易于解析的格式或将其转换为其他格式,例如 HTML .

    【讨论】:

      【解决方案2】:

      您可以对您给出的示例使用 DOM 解析器 - 它们是有效的 XML。但是,根据您的主题行,您将无法将其用于 非 XML

      当你说你可以有“标签嵌套的不同格式”时,你到底是什么意思?如果它总是简单嵌套,例如

      <root>
        <tag1>
          <tag2>
            <tag3>
              Stuff
            </tag3>
          </tag2>
        </tag1>
      </root>
      

      那就没问题了。但是,XML 解析器不喜欢“外部”标记在“内部”标记之前关闭的标记:

      <root>
        <tag1>
          <tag2>
            Stuff
          </tag1> <!-- Invalid -->
        </tag2>
      </root>
      

      【讨论】:

        猜你喜欢
        • 2013-07-24
        • 1970-01-01
        • 1970-01-01
        • 2010-12-25
        • 2012-02-28
        • 2013-01-31
        • 2013-07-18
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多