【问题标题】:Get <script> Tag, without contains multiple words获取 <script> 标签,不包含多个单词
【发布时间】:2014-12-29 10:37:52
【问题描述】:

我想获取所有不包含多个单词(域)的标签。这是我的代码:

document\.write\(.*<(script|scr\'\+\'ipt|scr\"\+\"ipt)(?!(google-analytics\.com|domain\.com).*)>.*\)

我想要什么:没有“google-analytics.com”和“domain.com”的所有标签

有人可以帮忙吗?

【问题讨论】:

  • 你用什么语言编程?
  • 赞成之前的评论,但这里更多的是对特定标签的 grep,因此应该可以使用正则表达式处理。对于 OP:某种源示例?您可以在regex101.com 上尝试一下,看看是否匹配。旁注:我不明白你第一个 ored 正则表达式的原因,对于脚本之间的引号,我需要看一个用例来理解你为什么这样做我认为......
  • @Philipp 是的,我经常听到。我也想用 xpath 试试
  • 我对 xpath 的问题是,我必须找到这些代码:

标签: regex whitelist


【解决方案1】:

正如 Philipp 所说,这不是解决我的问题的好方法。我已经用 xpath 解决了。

【讨论】:

    猜你喜欢
    • 2011-09-02
    • 1970-01-01
    • 1970-01-01
    • 2011-10-02
    • 1970-01-01
    • 1970-01-01
    • 2017-09-23
    • 1970-01-01
    • 2017-08-07
    相关资源
    最近更新 更多