【发布时间】:2011-01-28 21:09:48
【问题描述】:
有没有办法将 html 网页转换为 xml 并像 rss 提要一样获取数据(解析)?谢谢
【问题讨论】:
-
您要将 html 转换为 rss 提要吗?
-
我想将 html 转换为 xml 并进行 xml 解析,就像我们处理 rss 提要一样
有没有办法将 html 网页转换为 xml 并像 rss 提要一样获取数据(解析)?谢谢
【问题讨论】:
如果 html 格式正确,您可以使用常规 SAX 解析器来解析 html。
不幸的是,HTML 通常格式不正确。在这种情况下,您可以首先使用 tag-soup 在服务器上解析 html。如果这不可行,您可以尝试在设备上使用 jtidy。
【讨论】: