【发布时间】:2010-10-22 12:10:36
【问题描述】:
我很清楚,使用正则表达式解析 HTML 有许多警告和激烈的反对者。因此,与其尝试重新发明轮子,我正在寻找一种工具,我可以指向一个网页并说“给我这些 cmets,b*tch”。
谁能给点建议?
我正在阅读一些 OWASP 文档或安全博客,我几乎可以肯定我看到了执行此任务的工具。很遗憾,谷歌一直是零帮助。
干杯
【问题讨论】:
-
什么语言?另外,您想提取什么样的内容?所有的文字?一些文字?图片?你有示例页面吗?
-
@Pekka,你不能用 HTML 来做吗?天哪。