【问题标题】:Unzip apparently split .gz, .sit or .tar archive解压缩明显拆分的 .gz、.sit 或 .tar 存档
【发布时间】:2019-07-26 10:58:09
【问题描述】:

我们有一个旧的字典软件,似乎将数据存储在 SQLite 数据库中(软件附带了一个 SQLite 可执行文件)。我们想提取这个数据库来创建一个机器学习数据库。 在已安装的文件夹中(在 Windows 上),我们找到了一个名为 DB 的文件夹,该文件夹似乎包含数据库。它包含以下文件:

4096.gz
4096.sit
4096.tar
4097.gz
4097.sit
4097.tar
....
4129.gz
4129.sit
4129.tar

我无法解压其中的任何一个(在我的 Macbook 上),我尝试了以下命令(在所有情况下都针对第一个和最后一个文件):

  • tar -xvf 4129.tar --> tar:无法识别的存档格式。
  • gunzip 4129.gz --> gunzip: 4129.gz: 不是 gzip 格式。
  • 使用了 Stuffit(在 MacOS 上)--> StuffIt 引擎无法确定文件格式。
  • Unarchiver 和存档实用程序也不起作用。

所以我的问题:
- 有人知道/在某处见过存储“格式”,它似乎以三种并行归档格式出现?
- 我可以做些什么来进一步调查这些格式?或者它们可能是加密的?
- 有人知道我如何获取数据吗?

非常感谢您的帮助!

【问题讨论】:

    标签: archive unzip ziparchive gunzip


    【解决方案1】:

    你试过在windows电脑上使用winrar或winzip吗?这些应用程序应该能够打开 .gz 和 .tar 。

    如果失败,则这些文件不是那些格式。也许他们有扩展,但不是真正的内容。应用程序的内容可以是任意的,并且可以使用这些扩展来“混淆”。

    作为一种验证方式,如果您有 HEX 编辑器,请检查签名:

    • gz 应该从 1F 8B 开始
    • tar 应该以 75 73 74 61 72 (ustar) 开头
    • sqlite 应该以 53 51 4c 69 74 65 (SQLite) 开头

    看看这个维基百科如何通过签名找出文件的内容:https://en.wikipedia.org/wiki/List_of_file_signatures

    如果您确定应用程序使用 SQLite,请查找 SQLite 签名。

    【讨论】:

    • 非常感谢您的回答!我试过你的建议。我找不到已知的签名。但是,这些文件似乎从前编号:
    • 对不起,我还在学习这里的规则,试图编辑我的评论太久了。非常感谢您的回答!我试过你的建议。我找不到已知的签名。 .gz 文件在第一个和第四个字节中编号,从后到前: DE F8 01 D4--> DF F8 01 D5 --> E0 F8 01 D6 .tar 以 FE D0 FC 9X 开头(X 是可变的).sit以 00 00 开头所以不幸的是它似乎不是标准的文件格式...
    • 不幸的是,我找不到任何带有这些签名的文件,它可能是一种专有的包装格式。它可以用于:1- 混淆或 2- 优化。然而,连续的数字只是提醒我作为磁盘 FAT(或 BAM)表,第一个字节表示在读取文件内容后它应该继续下一步。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-08-23
    • 1970-01-01
    • 2016-10-08
    • 2019-02-25
    • 1970-01-01
    相关资源
    最近更新 更多