【发布时间】:2018-03-11 19:25:56
【问题描述】:
大家好,我正在尝试通过应用 CNN + Dense + CTC 来解决 TIMIT 任务
所以基本上这是我的模型:
1) 一些 ConvLayers2D。
2) 形状变换
3) 密集
4) 四氯化碳
所以转换是:
在 CNN 之后,我得到一个形状的输出 (Batch_size,number_of_feature_maps,41, sequence_length) 41 是梅尔滤波器组/能量
我将其转换为 (Batch_size,sequence_length,41*number_of_feature_maps) 以获得 3 的暗淡:
请注意,sequence_length 为 None,因为它因每个 mini_batch 而异,所以我们有类似 (None,None, X) 的东西
和
我基本上不明白这两种方法的行为。第一个 TimeDistributed 可以正常工作,损失和音素错误率降低。问题是第二个也有效! . Dense 层在 (None,None,X) 张量上做了什么?
谢谢!
【问题讨论】:
标签: tensorflow keras