【发布时间】:2018-07-23 02:21:10
【问题描述】:
我正在尝试在一些包含短语分隔符的文本中使用 word2vec,例如
I <phrase>like green beans</phrase> in my tortillas.
在将文本输入 word2vec 之前,我需要输入:
I __like_green_beans__ in my tortillas.
我一直在尝试使用 sed 进行替换。通过做
sed -e 's@<phrase>\(.*\)</phrase>@__\1__@g' myfile.txt
我可以去掉分隔符,但我还没有找到替换捕获组中空格的方法。
如果可以使用 sed 有什么想法吗?
【问题讨论】:
-
感谢@PesaThe,我能够使用其中描述的 perl 方式获得我想要的结果。