【问题标题】:File type in java (Windows,unix)java中的文件类型(Windows,unix)
【发布时间】:2026-02-01 22:45:02
【问题描述】:

我实现了一个从命令行获取输入文件的代码。然后,对该输入进行排序。然后将输出写入当前目录。我的代码有效,但我想知道那种类型的文件。 如图所示,我的 input.txt 类型是 dos\Windows。 我生成的 output.txt 类型是 UNIX。它们的尺寸也不同。为什么它们以不同的格式存储?我使用了,bufferedReader,fileWriter来实现这段代码。

code.java:

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.Arrays;
import java.io.FileWriter;

public class code{

    public static void main(String[] args) {


        try (BufferedReader br = new BufferedReader(new FileReader(args[0])))
        {

            int lines = 0;
            while (br.readLine() != null) lines++; // to get text's number of lines 

            String sCurrentLine;
            BufferedReader br2 = new BufferedReader(new FileReader(args[0])); //to read and sort the text

            String[] array; //create a new array
            array = new String[lines];

            int i=0;
            while ((sCurrentLine = br2.readLine()) != null) {//fill array with text content
                array[i] = sCurrentLine;
                i++;
            }
            Arrays.sort(array); //sort array


            FileWriter fw = new FileWriter("output.txt");

            for (i = 0; i < array.length; i++) { //write content of the array to file
                fw.write(array[i] + "\n");
            }
            fw.close();


            System.out.println("Process is finished.");


        } catch (IOException e) {
            e.printStackTrace();
        } 

    }
}

输入.txt:

x a t f a s f g h j n v x z s d f g b s c d e d d

输出.txt:

a a b c d d d d e f f f g g h j n s s t v x x z

SS-s

如何生成 windows 格式的输出文件(另外,它们的大小应该相同)?

【问题讨论】:

  • 它们的大小不会相同,DOS 和 Unix 使用不同的行尾。在 Unix 系统上,行尾是\n;而在 DOS/Windows 上是 \r\n.
  • 我的愿望是使尺寸相同。是的,它们是不同的。

标签: java file-io operating-system bufferedreader filewriter


【解决方案1】:

您遇到的现象是 UN*X 系统和 Microsoft Windows 系统之间的行尾字符不同。这些系统更喜欢使用不同的字符序列来表示行尾。

  • UN*X 系统使用 LF(换行)字符(\n,ASCII 中的 0x0A)
  • Windows 系统使用 CR(回车)和 LF(换行)字符(\r\n、ASCII 中的 0x0D 和 0x0A)

您声明要使用 Windows 变体。在这种情况下,您不应该将"\n" 附加到新文件中的每一行。天真的方法是使用"\r\n",但有更好的方法:

Java 使您能够获得当前平台的首选行尾字符序列。您可以通过调用System.getProperty("line.separator") (System.lineSeparator() (≥ Java 7) 获取平台的行尾字符序列。

因此,总结一下,您应该更改以下行:

fw.write(array[i] + "\n");

fw.write(array[i] + System.lineSeparator());

【讨论】:

  • 程序被危险地编写为使用“系统默认”字符集和编码。 (几乎可以肯定它不是 ASCII。)您很好地解释了观察到的效果,但是对于不同的数据,编码的差异也会出现。除非有充分的理由不这样做,否则文件应该是 UTF-8。可能需要系统默认值,但不应在系统之间传输此类文件。
【解决方案2】:

Windows 上的行尾与其他平台上的不同。你总是写 "\n" 这是 Unix 行的结尾。

虽然您可以简单地将其硬编码到 Windows 行尾 ("\r\n"),但如果您希望您的代码在任何地方都能工作,您应该使用平台行分隔符。一种方法是从系统属性中获取:

fw.write(array[i] + System.getProperty("line.separator"));

一种更易读的方法是将您的 FileWriter 替换为 Formatter:

Formatter fw = new Formatter("output.txt");

for (i = 0; i < array.length; i++) { //write content of the array to file
    fw.format("%s%n", array[i]);
}
fw.close();

【讨论】: