我一直在玩这个在线演示的浏览器内https://cs.stanford.edu/people/karpathy/convnetjs/demo/image_regression.html,我一直在努力使图像与文字(与“狐狸说什么...”标题)显示更清晰(与可读的文字)无济于事。过度装配神经网络的最佳方法是什么?
该神经网络接收两个输入 - 一个像素的X和Y位置和三个输出 - 所述像素的RGB通道。网络由选定的图片进行训练,然后尝试“绘制”它。
我想训练这个网络的方式,使每个像素匹配尽可能接近原始图像,即使其过度使用。这怎么能实现?应该使用什么组合或参数?也许网络的结构需要不同(更多层,更多层中的神经元,不同类型的层等)?
我试着学习速度播放,无需改变原有的结构,但即使在400K迭代大部分文字都是没有区别:
难道仅仅是一个时间问题和也许经过几百万次的迭代后会达到预期的结果?它可以以某种方式加速(不增加处理能力和其他明显的东西)?
看来,让它每次都为同样的输入返回相同的值应该是一件非常简单的任务 - 网络正在接受数十万次的完全相同的数据训练,为什么它仍然会返回那么多灰色像素?
我是新来的神经网络,所以也许这是一个愚蠢的问题,神经网络根本无法使用。
你试过语义分割吗? –
不能。你能告诉我怎么用这个特定的JS库来完成它吗? –
我不知道这个JS库,但我用Caffe中的图像语义分割。 –