【发布时间】:2017-11-06 06:05:38
【问题描述】:
我在 html 标签之间有文本。例如:
<td>vip</td>
标签之间有任何文字<td></td>
如何从这些标签中剪切任何文本并在这些标签之间放置任何文本。
我需要通过 bash/shell 来完成。
我怎样才能做到这一点 ?
首先,我试图得到这个文本,但没有成功
sed -n "/<td>/,/<\/td>/p" test.txt。但结果我有
<td>vip</td>。但根据文档,我应该只得到vip
【问题讨论】:
-
首先,我尝试获取此文本,但没有成功
sed -n "/<td>/,/<\/td>/p" test.txt。结果我有<td>vip</td>。但根据文档,我应该只得到vip -
你应该使用 html 解析器,而不是正则表达式。
-
您的 sed 尝试失败,因为它是一个线条工具,因此会打印出满足您条件的整行。
-
首先,你能保证
<td>和</td>标签在同一行吗? -
显示更多上下文,应该有父
<table>标签
标签: bash shell sed replace grep