【发布时间】:2011-02-27 14:34:58
【问题描述】:
我需要从 Android 中的非结构化网页中提取信息。我想要的信息嵌入在没有 id 的表中。
<table>
<tr><td>Description</td><td></td><td>I want this field next to the description cell</td></tr>
</table>
我应该使用
- 模式匹配?
- 使用 BufferedReader 提取信息?
或者有没有更快的方法来获取这些信息?
【问题讨论】:
-
你不应该用正则表达式解析 HTML:blog.codinghorror.com/parsing-html-the-cthulhu-way
标签: android html web-scraping