【发布时间】:2017-12-11 17:08:52
【问题描述】:
我正在运行一个模型来检测图像中的一些有趣特征。我有一组尺寸为 600x200 像素的图像。这些图像具有我想识别的岩石碎片等特征。想象一下覆盖在图像上的 (4x12) 网格,我可以使用 ((4,9), (3,10), (3,11), (3,12)) 等注释工具手动生成注释,以识别图像中有趣的单元格。我可以用 Keras 构建一个 CNN 模型,输入为灰度图像。但是我应该如何对输出进行编码。一种对我来说似乎很直观的方法是将其视为形状为(12,4,1) 的稀疏矩阵,只有有趣的单元格有 1,而其他单元格有 0。
- 是否有更好的方法对输出进行编码?
- 最后一层的激活函数应该是什么?我将 ReLU 用于隐藏层。
- 损失函数应该是什么?
mean_squared_error会起作用吗?
【问题讨论】:
-
为什么不用“较小的网络 (4*12)”分割图像并分别对每个网格场进行分类
-
这些图像是从圆形钻孔中展平的。所以我对正弦模式感兴趣,以识别有趣的地质特征,而不是其他看起来相似但不是正弦的岩石特征。
标签: python machine-learning neural-network deep-learning keras