【发布时间】:2013-10-23 21:36:29
【问题描述】:
我有一个 cURL Bash 脚本,它可以访问网站并发布数据,然后将其返回到文本文件。文本文件全部以 HTML 形式返回,我不知道如何从中提取我需要的信息。这是 Info.txt 中的 HTML:
<table cellspacing="1" cellpadding="0" border="0">
<tr><td><img src="/themes/img/status/green.gif" width="12" height="12" border="0"/></td><td><font class="small"><i>October 15, 2013 @ 1:34pm (PST)</i></font></td></tr>
<tr><td><font class="small">MF: </font></td><td><font class="small">PSVBHP9001230079779201</font></td></tr>
<tr><td><font class="small">SN: </font></td><td><font class="small">1354716309166</font></td></tr>
<tr><td><font class="small">ID: </font></td><td><font class="small">800.10</font></td></tr>
</table>
我需要提取这三个值:
- PSVBHP9001230079779201
- 1354716309166
- 800.10
我已经使用 grep 进行了尝试,但没有取得太大的成功。我似乎无法弄清楚如何只提取我想要的值。我也尝试了多个 sed 和 awk 命令,但最接近的是这个 grep 命令:
$ grep -o '[^ ]*.PSV[^ ]*' Info.txt
<tr><td><font>PSVBHP9001230079779201</font></td></tr>
【问题讨论】: