【发布时间】:2024-01-22 10:49:01
【问题描述】:
我在一个文件(每行一个)中有一个很大的 URL 列表(数百万),如下所示:
http://someDomain.com/articlex=123&b=23
http://KEYWORDindomain.net/blahblah
http://anotherKEYWORDindomain.org/blahblah/blip/q=123
http://blabkkk.org/KEYWORD/blip/q=123
(etc)
我想打印出某个关键字出现在网址的域部分的所有网址。
例如
grep <regex>KEYWORD<regex> file
output
======
http://KEYWORDindomain.net/blahblah
http://anotherKEYWORDindomain.org/blahblah/blip/q=123
我认为这应该很容易被 grep 支持,但在找出正则表达式时遇到了麻烦。也许我需要管道几个命令来达到我想要的结果?
我得到的最接近的是:grep "http://.*\?/"
谁有使用 shell 命令的好方法?
【问题讨论】: