【发布时间】:2017-09-10 22:31:48
【问题描述】:
我有一堆音频文件,需要根据静音和使用SOX 拆分每个文件。但是,我意识到有些文件的背景非常嘈杂,而有些则没有,因此我不能使用一组参数来迭代所有进行拆分的文件。我试图弄清楚如何通过嘈杂的背景将它们分开。这是我从sox input1.flac -n stat 和sox input2.flac -n stat 得到的信息
Samples read: 18207744
Length (seconds): 568.992000
Scaled by: 2147483647.0
Maximum amplitude: 0.999969
Minimum amplitude: -1.000000
Midline amplitude: -0.000015
Mean norm: 0.031888
Mean amplitude: -0.000361
RMS amplitude: 0.053763
Maximum delta: 0.858917
Minimum delta: 0.000000
Mean delta: 0.018609
RMS delta: 0.039249
Rough frequency: 1859
Volume adjustment: 1.000
和
Samples read: 198976896
Length (seconds): 6218.028000
Scaled by: 2147483647.0
Maximum amplitude: 0.999969
Minimum amplitude: -1.000000
Midline amplitude: -0.000015
Mean norm: 0.156168
Mean amplitude: -0.000010
RMS amplitude: 0.211787
Maximum delta: 1.999969
Minimum delta: 0.000000
Mean delta: 0.091605
RMS delta: 0.123462
Rough frequency: 1484
Volume adjustment: 1.000
前者不包含嘈杂的背景,而后者包含。我怀疑我可以使用Max delta 的Sample Mean,因为差距很大。
谁能为我解释这些统计数据的含义,或者至少告诉我我自己在哪里可以得到它(我尝试在官方文档中查找,但他们没有解释)。非常感谢。
【问题讨论】: