【问题标题】:Store Numbers as Binary in files将数字以二进制形式存储在文件中
【发布时间】:2012-01-07 17:08:27
【问题描述】:

我的文件中有以 ASCII 码形式写入的数字。例如“9”存储为两个字节 57,即总共 8 位。

我想通过将这些数字存储为二进制值来优化存储,例如 0-9 的数字仅使用 4 位存储。

有什么帮助吗?!

【问题讨论】:

  • 您的意思是“9”存储为“57”吗?我看不到 ascii 57 如何使用 2 个字节。
  • yes char "9" 以两个字节的形式存储在文件中,一个是 5,另一个是 7
  • 你很可能在这里用你的算法制造错误。你不能使用 Zip 库来压缩你的文件吗? Zip 或存档库的算法比您自己想出的要复杂得多。
  • 顺便说一句:'9' 占用一个字节,两个带有分隔符。如果将其存储为 int 二进制文件,则需要 4 个字节,这是两倍大。使用二进制并不能保证它会小得多。如果你想要更紧凑,我建议使用 GZIPOutputStream 来压缩数据。

标签: java file ascii store


【解决方案1】:

如果你写字符,每个字符需要 1 个字节。您必须编写二进制或布尔数据。您可以表示 5=>0101,但如果您将 0101 写为字符,则需要 4 个字节,如果您写二进制或布尔值,则需要位。

【讨论】:

    【解决方案2】:

    你可以把它们写成二进制

    import java.io.ByteArrayInputStream;
    import java.io.FileInputStream;
    import java.io.FileOutputStream;
    import java.io.IOException;
    
    
    public class Bin {
        public static void main(String[] args) throws IOException {
            FileOutputStream fos = new  FileOutputStream("\\test.bin");
            String digits="12345";
            char[] chars = digits.toCharArray();
            for ( int i = 0 ; i < chars.length ; i+= 2 ) {
                byte b1 = (byte) (chars[i] - (byte) '0');
                byte b2 = (byte) (i < chars.length-1 ? chars[i+1] - (byte) '0' : 0xf);
                fos.write((byte) ((b1 << 4) | b2 ));
            }
            fos.close();
            FileInputStream fis = new FileInputStream("\\test.bin");
            StringBuffer result = new StringBuffer();
            byte[] buf = new byte[100];
            int read = fis.read(buf);
            ByteArrayInputStream bais = new ByteArrayInputStream(buf);
            for ( int i = 0 ; i < read ; i++ ) {
                byte both = (byte) bais.read();
                byte b1 = (byte) ((both >> 4 ) & 0xf);
                byte b2 = (byte) (both  & 0xf) ;
                result.append( Character.forDigit(b1, 10));
                if ( b2 != 0xf ) {
                    result.append(Character.forDigit(b2,10));
                }
            }
            System.out.println(result.toString());
        }
    }
    

    但我怀疑这会很有用

    【讨论】:

    • 太棒了!伙计,请告诉我,我怎样才能读回我的字符并将它们存储在一个字符串中。我们开始的字符串
    • @shaklasah 读回它们比我想象的要困难得多,注意写的 0xf 以防源字符串是奇数。它被用作填充,因为我们只能写入完整的字节。
    【解决方案3】:

    我会坚持使用标准DataOutputStream,它可以以可移植的方式将原始类型写入输出。

    它有writeLongwriteInt。使用这些方法,您可以写出数据,然后使用DataInputStreamreadLongreadInt 加载它。

    如果这不够紧凑,您可以稍后使用任何压缩库对其进行压缩。

    【讨论】:

      【解决方案4】:

      这个呢? 0 => 0000 1 => 0001 2 => 0010 3 => 0011 4 => 0100 5 => 0101 6 => 0110 7 => 0111 8 => 1000 9 => 1001

      【讨论】:

      • 是的,但我要如何将它写入文件?!
      • 可以使用文件输出流写入文件
      • 是的,但这会将每个数字再次视为两个字节,并且会变得更糟,因为 0000 将被视为 8 个字节:S
      • 在这种情况下你应该编写自己的转换机制。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-08-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多