【发布时间】:2019-03-04 16:32:44
【问题描述】:
如何使用 sed 删除 html 文件中的所有脚本标签?
我尝试了这个但不起作用,下面的命令不会从test1.html中删除任何脚本标签。
$ sed -e 's/<script[.]+<\/script>//g' test1.html > test1_output.html
我的目标是从 test1.html 到 test1_output.html
test1.html:
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
</head>
<body>
<h1>My Website</h1>
<div class="row">
some text
</div>
<script type="text/javascript"> utmx( 'url', 'A/B' );</script>
<script src="ga_exp.js" type="text/javascript" charset="utf-8"></script>
<script type="text/javascript">
window.exp_version = 'control';
</script>
</body>
</html>
test1_output.html:
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
</head>
<body>
<h1>My Website</h1>
<div class="row">
some text
</div>
</body>
</html>
【问题讨论】:
-
“不起作用”。你应该与大家分享它是如何不起作用的。结果或错误是什么?此外,可能相关,如果不是重复的话:stackoverflow.com/q/19878056/1531971(那里的信息也可以扩展到这种情况。)
-
@jdv 命令“不起作用”原因什么也没做(我不知道为什么),出现任何错误。
-
但是我们怎么会知道呢? “不起作用”可能是错误的结果,零结果,紫色的猴子从你的 USB 端口飞出,谁知道呢?我们的想法是告诉我们您想做什么,展示您的尝试并分享结果。
-
tks @jdv 谢谢,希望问题现在写得更好
-
我永远不会放弃分享这个的机会:stackoverflow.com/a/1732454/1531971