【发布时间】:2017-10-22 14:25:19
【问题描述】:
我在理解本文中描述的model 是如何设计的方面似乎有些问题
这是关于模型维度的内容..
...在这些实验中,我们使用了一个卷积层,一个池化层 和顶部的两个完全连接的隐藏层。全连接的 每个层有 1000 个单位。卷积和池化参数 分别是:池大小为 6、移位大小为 2、过滤器大小为 8、150 个特征 FWS 的地图..
所以根据 ^ 模型是否包含
输入
卷积
池
输入是 150 个特征图(每个特征图的形状为 (8,3)
卷积为 1d,内核大小为 8
池的大小为 6,步幅为 2。
预期的输出将是(1,“过滤器数量)的形状,但我得到的是(14,”过滤器数量)
我明白我为什么会得到,但我不明白论文如何建议这可以给出(1,“过滤器数量”)的输出形状
当使用 100 个过滤器时,我会从每一层获得这些输出
convolution1d 给我 (33,100)
汇集 (14,100)..
为什么我希望输出是 1 而不是 14
该模型应该识别电话,它需要 50 帧(包括增量在内的 150 帧)作为输入,这些是上下文帧,这意味着这些被用作检测单个帧的支持......这通常是为什么上下文使用窗户。
【问题讨论】:
-
不清楚这个问题在问什么我一直跟着你直到最后你得到了什么结果,什么是没有预料到的
-
希望现在更有意义..
标签: deep-learning classification dimension