【发布时间】:2017-09-21 21:54:36
【问题描述】:
我正在研究 Keras 上的机器学习问题。我的目标是训练一个模型,其输入为(4214, 22311) 矩阵,输出为(22311,) 向量。
这样的二维数据可以被视为图像输入,但大多数图像分类器仅适用于形状为(200, 200)的小图像。
我尝试了几种在 Keras 上构建模型的方法,例如 CNN、双向 LSTM 或简单的神经网络(扁平和密集)。但它们都不起作用。
我没有完成一个纪元就收到了killed。所以我想知道什么样的结构可以处理这么大的输入。
【问题讨论】:
-
实际输入是
(4214,1)的形状,但我连接了一些固定数据以将(4214,1)转换为(4214, 22312)。等效地,我们可以将输入形状视为(4214, 22312) -
2 万亿参数???哇。最好的机会是使用
GlobalMaxPooling的完全卷积模型,或者可能是有状态的 LSTM 模型。 -
问题:4214项不是独立的吗?我认为(根据您之前的问题)它们是单独的样本。
-
另外,所有 22311 项在所有 4214 行中都完全相同的事实让我想了很多关于这是否是最好的方法....
-
一个数据样本由 4214 个特征描述,因此我们有 4214 个输入条目。假设它们是独立的。是的,在我的最后一个问题中,其他 22311 项与 4214 行相同,所以除了使用 CNN 之外,您认为还有哪些其他方法可行?
标签: machine-learning tensorflow neural-network keras recurrent-neural-network