我正在运行一个模型来检测图像中的一些有趣功能。我有一组图像测量600x200像素。这些图像具有我想识别的岩石碎片等特征。设想一个覆盖在图像上的(4x12)网格,我可以使用注释工具(如((4,9), (3,10), (3,11), (3,12))
)手动生成注释以识别图像中感兴趣的单元格。我可以用Keras构建一个CNN模型,将输入作为灰度图像。但是,我应该如何编码输出。这似乎直觉对我的一种方法是把它当作形状(12,4,1)
的稀疏矩阵,只有有趣的细胞具有1,而其他都为0我的CNN输出层应该是什么样子?
- 有没有更好的方式来编码输出?
- 最后一层应该是什么激活功能?我正在使用ReLU作为隐藏层。
- 损失函数应该是什么?将
mean_squared_error
工作?
为什么不分割你的图像,并用“小型网络(4 * 12)”来划分每个网格区域? –
这些图像从圆形钻孔中展平。因此,我对正弦曲线模式感兴趣,以识别有趣的地质特征,而不是其他看起来相似但不是正弦曲线的岩石特征。 –