【发布时间】:2015-05-26 20:43:25
【问题描述】:
我有 170 个 1GB 的二进制文件,每当我找到特定的 ASCII 字符串时,我都想在其中拆分它们。其中一些字符串也有换行符。
csplit 似乎是完成这项任务的完美工具,但它似乎不适用于二进制文件。
问题
如果我将搜索字符串转换为十六进制/二进制,这是否会使问题更容易解决,所以它是二进制数据中的二进制搜索?
如果不是,我如何根据 ASCII 字符串拆分二进制文件,其中一些字符串有换行符?
【问题讨论】:
-
你想要 python、perl 还是 bash 代码?
-
我对所有这些都是开放的 =) 最容易解决问题的那个 =)
-
csplit在什么情况下不起作用? -
binary 文件没有什么特别之处,只是它们通常包含不会出现在文本文件中的字节,而且当你打印它们。它们仍然是必须理解的八位字节序列,大多数体面的语言都可以让你做到这一点。
-
csplit按行工作。
标签: python linux bash perl split