【发布时间】:2014-03-13 12:52:33
【问题描述】:
输入内容是从webkit窗口复制的一段html,比如
它在使用 UTF-8 的 web-kit 中正确显示。
我要做的是替换所有标签,我使用这个单行:
perl -i -pe "s/<img.+?>//g"
输入是我复制到剪贴板并被另一个程序重定向到这个单行的富文本,可能是这样的:
echo "rich html text" | perl -i -pe "s/<img.+?>//g"
好吧,它确实删除了 <img> 标记,但所有 Unicode 字符在替换后都会损坏。
我使用的是 Windows 7,语言环境 En - 美国。 cmd 代码页已设置为 UTF-8。
即使我通过-C 选项,它也不起作用。
有没有办法让代码保持单行,同时使其适用于 Unicode 输入?
【问题讨论】:
-
而不是 perl,输出到标准输出或文件以确保这不是您的第一个程序,它首先会弄乱内容。