【问题标题】:HTML Comments ExtracterHTML 评论提取器
【发布时间】:2010-10-22 12:10:36
【问题描述】:

我很清楚,使用正则表达式解析 HTML 有许多警告和激烈的反对者。因此,与其尝试重新发明轮子,我正在寻找一种工具,我可以指向一个网页并说“给我这些 cmets,b*tch”。

谁能给点建议?

我正在阅读一些 OWASP 文档或安全博客,我几乎可以肯定我看到了执行此任务的工具。很遗憾,谷歌一直是零帮助。

干杯

【问题讨论】:

  • 什么语言?另外,您想提取什么样的内容?所有的文字?一些文字?图片?你有示例页面吗?
  • @Pekka,你不能用 HTML 来做吗?天哪。

标签: html security parsing


【解决方案1】:

如果您需要 Java 解决方案,请尝试 HTMLParser 并查找 RemarkNodes。

【讨论】:

    【解决方案2】:

    Mhhhhh...我认为使用您使用的操作系统和一些聪明的关键字在 Google 中进行搜索可以满足您的所有需求。对于基于 UNIX 的系统,请查看:parse HTML with SED and PERL

    对于 Windows 操作系统,我认为您可以使用 VBS (VBScript) 进行搜索。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-07-21
      • 2012-04-29
      • 2011-04-15
      • 2012-04-23
      • 2019-03-11
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多