【发布时间】:2016-04-12 01:30:26
【问题描述】:
我试图在正则表达式 101 中匹配此模式
<a href="http://google.com">Google.com</a>
<A target="_blank" href='http://example.com/files.html'>An Example</A>
<a id="link23" HREF = "file23.html" target="_TOP">File #23</a>
<a href="images/mypic.png">See my picture!</a>
<a href="mailto:joelross@uw.edu">Email Joel</a>
我做了这个正则表达式 - \s(HREF|href)\s?=\s?('|").('|")>.*
现在当我尝试通过命令行使用 grep 命令时,它会抛出一个错误。
./mdlinks.sh: line 3: unexpected EOF while looking for matching `"'
./mdlinks.sh: line 4: syntax error: unexpected end of file
这里是源文件
#! /usr/bin/env bash
CONTENT=$(curl $1)
echo "$CONTENT" | grep -E -o '<[aA].*\s(HREF|href)\s?=\s?('|").*('|")>.*<\/[aA]>' >> mdlinks.txt
【问题讨论】:
-
将 xmllint 与 xpath 查询一起使用:xmlsoft.org/xmllint.html
标签: regex linux bash shell grep