【发布时间】:2021-03-27 14:45:58
【问题描述】:
我正在尝试从文件中的句子中删除停用词?
我的意思是停止词:[I, a, an, as, at, the, by, in, for, of, on, that]
我在my_text.txt 文件中有这些句子:
Unix 系统设计的主要目标之一是 营造促进高效计划的环境
然后我想从上面的句子中删除停用词
我使用了这个脚本:
array=( I a an as at the by in for of on that )
for i in "${array[@]}"
do
cat $p | sed -e 's/\<$i\>//g'
done < my_text.txt
但是输出是:
Unix 系统设计的主要目标之一是 营造促进高效计划的环境
预期的输出应该是:
设计 Unix 系统的一个主要目标是 创造一个促进高效计划的环境
注意:我要删除删除停用词而不是重复词?
【问题讨论】: