【发布时间】:2018-05-02 16:29:38
【问题描述】:
我正在尝试使用 TensorFlow 训练标准的全连接神经网络(又名多层感知器)。我正在学习一个教程,其中使用 MNIST 手写数字数据集 (http://yann.lecun.com/exdb/mnist/) 训练了一个类似的神经网络。
但是,TensorFlow 提供了一些内置操作,我无法真正复制。
例如: 要加载数据,它会调用以下函数:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)
或从数据中加载下一批,它调用以下函数:
batch_x, batch_y = mnist.train.next_batch(batch_size)
有人知道音频数据的类似实现吗?我希望输入是 wav 文件的原始数据。我的数据结构是这样的:
data/
train/
up/
...
down/
...
...
test/
up/
...
down/
...
...
validate/
up/
...
down/
...
...
提前谢谢你!
【问题讨论】:
-
看看DCASE,这里有一个健康的社区。span>
标签: python audio tensorflow machine-learning