【发布时间】:2013-11-21 14:01:33
【问题描述】:
我需要使用 sed 命令使用 bash 脚本从 html 中删除所有标签。 我试过这个
sed -r 's/[\<][\/]?[a-zA-Z0-9\=\"\-\#\.\& ]+[\/]?[\>]//g' $1
还有这个
sed -r 's/[\<][\/]?[.]*[\/]?[\\]?[\>]//g' $1
但我还是想念一些东西,有什么建议吗??
【问题讨论】:
-
这是我最喜欢的关于 HTML 和正则表达式的答案 ;-) stackoverflow.com/questions/1732348/…
-
我完全知道,但这是一个家庭作业:-(
-
我的上学时间是很久以前的事了,但我认为家庭作业不一定能给出完美的答案。这也是为了表现出一些努力,并有勇气说,这就是我想出的全部。 :-)