【发布时间】:2011-10-28 19:05:03
【问题描述】:
我正在使用JSOUP(用于 XML 文件的 java 工具)并且我正在使用以下代码来读取保存在 XML 文件中的 URL。这是我的代码:
Document d = Jsoup.parse(new File("feed.xml"), null);
Element elementCat = d.getElementsByTag("cat").get(0);
String stringUrl = elementCat.ownText();
System.out.println(stringUrl);
XML 输入文件是这样的:
<?xml version="1.0" encoding="utf-8" standalone="no"?>
<root>
<cat>http://www.isna.ir/ISNA/FullNews.aspx?SrvID=Event&Lang=P</cat>
</root>
我的问题是程序的输出是这样的: http://www.isna.ir/ISNA/FullNews.aspx?SrvID=Event⟪=P 而不是这个: http://www.isna.ir/ISNA/FullNews.aspx?SrvID=Event&Lang=P
换句话说,它会自动将“&Lang”转换为“⟪”。 请注意不是“⟪”,只是没有分号的“&Lang”。 我想禁用编码或转义,我想要原始数据。
我该如何解决这个问题?
【问题讨论】:
-
jsoup 不只是 HTML 而不是 XML?
-
我认为你是对的。但是 JSOUP 也有强大的处理 XML 的功能,我不想阻止使用它们。
标签: java xml escaping urlencode jsoup