【问题标题】:MP3 bitrate detection through frequency spectrum analysis通过频谱分析检测 MP3 比特率
【发布时间】:2011-04-04 11:09:04
【问题描述】:

是否有任何程序可以检测 MP3 的比特率? 我说的不是文件编码的有效码率,而是只能通过频谱分析才能计算出的真实码率。

例如,如果我有一个以 128 kbps 编码且大小为 1 MB 的 MP3,然后我将此 MP3 转码为大小变为 3 MB 的 320 kpbs,我将拥有相同的音轨,但大小不同。

如果我有一个 320 kbps 的 MP3 并且我将其转码为 128 kbps,我会损失一些质量,因此会损失一些文件大小。

但是,我仍然无法验证 320 kbps 是我的 MP3 的“真实”比特率。

本文详细解释: http://www.fileden.com/files/2009/2/14/2321055/My%20Documents/MP3%20Bit%20Rate%20Quality%20Detection%20through%20Frequency.pdf

【问题讨论】:

  • 无论哪种方式,你都会损失质量,mp3 每次编码都会有损失......

标签: mp3 analysis detection bitrate spectrum


【解决方案1】:

首先,https://www.google.com/?q=mp3+cutoff+frequency 很有启发性。

其次,几乎所有 MP3 都使用带有相当标准的多相低通滤波器的预设进行编码。由于实际上不可能用 MP3 实现无损压缩,因此丢失的实际上是基频的高次谐波(参见 FFT、DCT、小波变换等);应用滤波器,以便频谱的后续傅里叶分析结果与人类听觉范围更加一致(即从分析中完全消除了听不见/掩蔽的频率)。实际上不可能在不切断/严重扭曲较高频率的情况下实现高压缩,因为实际上它们占据了比特流中的大部分空间。

当然,如果没有截止频率,频域限制会不太准确 - 但它会仍然发生。除其他原因外,应用了截止,以便在心理声学听力范围之外生成压缩伪影。

作为参考点 - 对流进行频谱分析(如果较高的频率范围足够饱和,则使用 Winamp 克隆的实时 SA 就足够了,如果您有工具也可以简单地做一个频谱图),然后找到分界点。在下面的示例中,截止发生在 @ 15 kHz,这告诉我流最初是在 @ 128 kbps 压缩的;我什至可以说,实际上可以将 通过耳朵与多种音乐区分开来(drum'n'bass 和其他具有很多高音的电子音乐流派)记住)。

最常见的截止点是:(请注意,它们在 CBR 中是“硬”,而在 ABR/VBR 中是“软”)

  • 128 kbps:15-16 kHz(非常在摇滚/电子音乐中听得见!“空间损失”效果)
  • 192 kbps : ~19 kHz(在大多数情况下几乎听不见,大多数人认为透明
  • 256-320 kbps : > ~20kHz(听不清)

是的,我知道 有些人 可以听到 20 kHz 以上的声音,但是音乐中出现的掩蔽效果加上扬声器的实际响应时间意味着在实际音乐中 20 kHz 截止是无关紧要的音质。

来源:作为音频工程师的自己的研究加 https://web.archive.org/web/20150313010213/http://www.whatinterviewprep.com/prepare-for-the-interview/spectral-analysis/ 作为附加参考

【讨论】:

    【解决方案2】:

    您可以打开文件“Adobe Audition”或“Cool Edit”并打开频率分析窗口。如果频率线达到 20khz 或更多 mp3 比特率可能是 320 kbps 如果频率线减小到 20khz 则不是 320kbps。

    【讨论】:

      【解决方案3】:

      截止频率和比特率是独立的。是的,大多数人使用预设,因此两者之间存在相关性,但不是确定性的。

      【讨论】:

        【解决方案4】:

        您可以从频谱分析中轻松确定的是输入 mp3 文件的采样频率是多少。

        例如,如果您的 mp3 以 44100 采样,您将不会有任何高于 22050hz 的声音,并且在频谱图上会清晰可见。

        既然你在这里穿越到超凡领域,试试这个:

        • 将 mp3 编码为 128kbps
        • 转码为 320kbps
        • 尝试 RAR-ing 或 7Z-ing 生成的文件和原始文件。观察压缩比。

        他们的“熵”,即。随机性会有所不同,也许该数字会告诉您在转码期间比特率扩展中“制造”了多少信息。

        【讨论】:

        • 如果转码过程 100% 符合标准,则根本不应“捏造”任何信息。不过,在 320 kbps 版本中会发生变化的一件事是立体声模式。 128 kbps 的默认值为联合立体声,而 320 的默认值为“真”立体声。因此,如果您尝试这样做,您可能应该为两种比特率强制使用相同的立体声模式。 (当然,采样频率也必须相同,但这不言而喻。)此外,320 kbps 版本应该在没有截止滤波器的情况下进行编码,因为它已经被应用了。
        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2021-09-25
        • 1970-01-01
        • 2014-05-23
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多