【问题标题】:Remove all non utf-8 characters from file with no output in terminal从文件中删除所有非 utf-8 字符,终端中没有输出
【发布时间】:2015-05-18 20:34:35
【问题描述】:

我是一个新的 Ubuntu 用户,正在处理一个非常大的文件,其中包含一些可以安全跳过的非 utf8 字符。我发现了另一个堆栈溢出问题How to remove non UTF-8 characters from text file,它提供了一种删除这些字符的方法,使用命令

iconv -f utf-8 -t utf-8 -c file.txt

但是对于我的文件的大小,这会输出每一行,这需要太多时间。我对 Ubuntu 命令不太熟悉,所以如果有人可以指导我修改该命令以抑制输出,我将不胜感激

【问题讨论】:

    标签: ubuntu utf-8 output


    【解决方案1】:

    使用 shell 重定向将转换输出到新文件:

    iconv -f utf-8 -t utf-8 -c file.txt > new-file.txt
    

    然后检查新文件的结尾:

    tail new-file.txt
    

    检查顶部:

    head new-file.txt
    

    【讨论】:

      【解决方案2】:

      您可以将输出重定向到一个新文件,而不是在终端上打印每一行:

      iconv -f utf-8 -t utf-8 -c file.txt > output.txt
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2016-07-25
        • 2020-06-01
        • 2015-05-12
        • 2018-01-23
        • 2018-01-05
        • 1970-01-01
        • 2011-06-28
        • 2011-04-04
        相关资源
        最近更新 更多