【发布时间】:2020-10-13 22:03:03
【问题描述】:
我对 tensorflow 比较陌生,因此我在数据准备方面遇到了困难。
我有一个包含大约 500 个 .txt 文件的文件夹。这些文件中的每一个都包含数据和数据的标签。 (数据代表 MFCC,它们是为 .wav 音频文件的每个“帧”生成的音频特征。)
每个文件如下所示:
1
1.013302233064514191e+01
-1.913611804400369110e+01
1.067932213100989847e+00
1.308777013246182364e+01
-3.591032944037165109e+00
1.294307486784356698e+01
5.628056691023937574e+00
5.311223121033092909e+00
1.069261850699697014e+01
4.398722698218969995e+00
5.045254154360372389e+00
7.757820364628694954e+00
-2.666228281486863416e+00
9.236707894117541784e+00
-1.727334954006132151e+01
5.166050472560470119e+00
6.421742650353079007e+00
2.550240091606466031e+00
9.871269941885440602e+00
7.594591526898561984e-01
-2.877228968309437196e+00
5.592507658015017924e-01
8.828475996369435919e+00
2.946838169848354561e+00
8.420693074096489150e-01
7.032494888004835687e+00
...
在每个文件的第一行,我得到了数据的标签(在本例中为 1)。 在文件的其余部分,我得到了 13 个数字,代表每帧 13 个 MFCC。每帧 MFCC 用换行符分隔。
所以我的问题是将所有这些文件的内容转换为张量以便 tensorflow 可以使用它们的简单方法是什么?
谢谢!
【问题讨论】:
标签: python tensorflow mfcc