【发布时间】:2014-12-29 10:37:52
【问题描述】:
我想获取所有不包含多个单词(域)的标签。这是我的代码:
document\.write\(.*<(script|scr\'\+\'ipt|scr\"\+\"ipt)(?!(google-analytics\.com|domain\.com).*)>.*\)
我想要什么:没有“google-analytics.com”和“domain.com”的所有标签
有人可以帮忙吗?
【问题讨论】:
-
你用什么语言编程?
-
赞成之前的评论,但这里更多的是对特定标签的 grep,因此应该可以使用正则表达式处理。对于 OP:某种源示例?您可以在regex101.com 上尝试一下,看看是否匹配。旁注:我不明白你第一个 ored 正则表达式的原因,对于脚本之间的引号,我需要看一个用例来理解你为什么这样做我认为......
-
@Philipp 是的,我经常听到。我也想用 xpath 试试
-
我对 xpath 的问题是,我必须找到这些代码: