【问题标题】:removing multibyte characters from a file using sed使用 sed 从文件中删除多字节字符
【发布时间】:2011-04-01 01:40:48
【问题描述】:

我需要从文件中删除所有多字节字符,我不知道它们是什么所以我需要覆盖整个范围。

我可以像这样使用 grep 找到它们: grep -P "[\x80-\xFF]" '我的文件'

试图用 sed 做一个类似的事情,但改为删除它们。

干杯

【问题讨论】:

    标签: sed multibyte


    【解决方案1】:

    试试这个:

    LANG=C sed 's/[\x80-\xFF]//g' filename
    

    【讨论】:

      【解决方案2】:

      您可以使用iconv 将一种编码转换为另一种编码

      【讨论】:

        猜你喜欢
        • 2013-10-24
        • 2019-04-01
        • 1970-01-01
        • 2015-05-12
        • 2016-12-30
        • 2012-04-09
        • 2018-06-15
        • 2017-05-28
        相关资源
        最近更新 更多