【发布时间】:2013-08-29 07:24:15
【问题描述】:
我有一段内容同时包含 html 和 rss,我想将它们分开并存储在单独的字符串中。所以,我试图根据它们的开始和结束标签来解析它们,并在 rss /rss 之间抓取内容。
代码适用于 html 和 /html。但是我看到 rss 和 /rss 的错误。
下面是我的代码 sn-p。
// parse the responseStr to html
html = responseStr.substring(responseStr.indexOf("<html>"),
responseStr.lastIndexOf("</html>") + 7);
System.out.println("html string"+html );
有人可以指导我下面的代码有什么问题吗?
// parse the responseStr to rss
rss = responseStr.substring(responseStr.indexOf("<rss version="2.0">"),
responseStr.lastIndexOf("</rss>") + 6);
System.out.println("rss string = "+rss );
我得到以下异常:
java.lang.StringIndexOutOfBoundsException
at java.lang.String.substring(String.java:1093)
【问题讨论】:
-
我看到错误是什么意思 - 另外,您可以发布您要解析的文本吗?
-
为什么不使用库?一个 xml 解析器至少可以让你使用 xpath
-
您看到了什么错误?请在问题中添加它们
-
如果你的输入字符串是
<rss> ... </rss>,上面的代码对我有用。请发布您的输入字符串。 -
机会是
responseStr.lastIndexOf("</rss>") + 6不存在