【发布时间】:2012-03-13 17:22:43
【问题描述】:
我正在使用 Java 和 SAX 从搜索引擎实现 RSS 搜索功能。但是,某些搜索结果的格式不正确,即某些条目的 <title> 标记的正文包含 &amp; 字符而不是 &amp; 等(例如,比如 Starsky & Hutch)。
在解析 RSS 时,我得到一个 org.apache.harmony.xml.ExpatParser&ParseException,导致整个搜索中断并且什么也不返回。
我希望我的解析器能够解决这些错误,就像 Firefox 的 RSS 阅读器一样。有哪些方法可以解决此问题并解析 RSS 提要?
【问题讨论】:
-
RSS 提要解析器怎么样? stackoverflow.com/search?q=%5Bjava%5D+rss+parser
-
如果格式不正确,则不是 RSS 提要。一个迂腐的观点,但至关重要。
-
@skaffman 我同意你的看法。但这让我别无选择,只能放弃那个提要。太糟糕了,虽然这是他们的错
标签: java rss sax well-formed