【发布时间】:2017-06-01 16:20:36
【问题描述】:
我在一个文件中获取了垃圾字符(<9f>、<9d>、<9d> 等)、CNTRL 字符(^Z、^M 等)和NULL 字符(^@) .但是,我能够从文件中删除 CNTRL 和 NULL 字符,但无法消除垃圾字符。谁能建议一种方法来删除这些垃圾字符?
正在使用以下命令删除控制字符:
sed 's/\x1a//g;s/\xef\xbf\xbd//g'
使用以下命令删除空字符
tr -d '\000'
另外,请建议一个命令来删除所有上述 3 种类型的 garbal 字符。
提前致谢
【问题讨论】:
-
Dos2Unix 也无法正常工作。错误状态“转换文件时出现问题”
-
文件的编码是什么?您可以将文件粘贴到 pastebin.com 上吗?
-
文件编码为utf-8。抱歉,我无法放置文件。
标签: shell unix unicode strip null-character