backpropagation

    1热度

    1回答

    如果我的数据集中有1000个观测值,包含15个特征和1个标签,输入神经元中的数据如何进行正向传递和反向传播?对于1000次观测(一次一个),是否按行进行排序并且每次观测都要更新权重,或者是根据输入矩阵给出完整数据,然后是多个时期,网络学习相应的权重值?同样,如果它是一次喂食,那么在这种情况下的时代是什么? 谢谢

    1热度

    1回答

    我已经看到,https://www.quora.com/If-one-initializes-a-set-of-weights-in-a-Neural-Network-to-zero-is-it-true-that-in-future-iterations-they-will-not-be-updated-by-gradient-descent-and-backpropagation 说,零值权重

    0热度

    1回答

    在Double DQN(在CNTK中实现)中,我试图使用在线模型计算下一个状态的值(post_state_var)。为了矢量化我的解决方案,我使用了one_hot op。但是,当我尝试训练时,出现以下错误: 节点“OneHot”可用于训练,但不参与梯度传播。 我定义我的模型和投入: state_var = cntk.input_variable(state_shape, name='state')

    2热度

    1回答

    我正在研究神经网络。我正在探索使用大型数据集进行培训的效果。目前我正在蹩脚的结果。有什么建议么?我不想使用除numpy以外的任何库,请保持简单。我是一名GCSE学生,所以我对微积分也不了解。 为了提高我的网络IVE说: 第二隐藏层, 多个时期, 不同的激活功能(RELU而不是乙状结肠),每层 更多隐藏节点...但我的结果仍然是可怕的! import numpy as np x = np.arr

    0热度

    1回答

    我使用python OpenCV模块实现了ANN(隐藏层数为64个单元,学习率= 0.001,ε= 0.001,iters = 500)。训练错误〜3%,测试错误〜12% 为了提高神经网络的收敛性/泛化性,我决定继续执行模型选择(#隐藏单位和学习率)以获得准确的值超参数和绘制学习曲线来确定是否需要更多数据(目前有2.5k)。 已经阅读了有关神经网络训练和模型选择一些消息来源,我对以下事项很困惑 -

    3热度

    2回答

    我正在建立一个神经网络来学习识别来自MNIST的手写数字。我已经证实反向传播可以完美地计算梯度(梯度检查给出了错误< 10^-10)。 看来,无论我如何训练权重,成本函数总是倾向于大约3.24-3.25(从不低于该值,从上方接近),训练/测试集精度非常低(约为11%测试装置)。看来最终的h值都非常接近0.1并且相互之间。 我找不到为什么我的程序无法产生更好的结果。我想知道是否有人可以看看我的代码,

    0热度

    1回答

    我一直在努力获得反向传播的一些熟练,并且已经运行了标准的数学公式来做到这一点。我实施了一个似乎可以正常工作的解决方案(并通过了有关飞行颜色的相关测试)。 但是...实际的解决方案(在MATLAB中实现,并使用向量化)在两个重要方面与公式不一致。 的计算公式如下: 三角二层=(θ-二层转)×Δ-三层点X gprime( - 现在并不重要) 工作代码如下所示: % d3 is delta3, d2 i

    1热度

    1回答

    我处于理解backpropagation的初期阶段,我试图自己实现它。 我试图使用的数据集是大小为(150,4)的虹膜数据集。 我只是担心backpropagation而不是梯度下降,所以我只是在一个例子上尝试我的算法,看看我能否得到一个看似正确的输出。 但是,我的问题是试图让我的渐变为我的初始权重矩阵,我得到的形状错误。 我想我的网络是这样的 - 4输入,8个隐神经元,和1个输出神经元 我的代码

    0热度

    1回答

    我试图预测特定日期的太阳能值。为此,我使用人工神经网络模型。我在决定正确的激活函数时遇到问题。由于sigmoid函数给我输出0-1,我想有和输出像256.33。所以我想为隐藏层应用sigmoid,为输出层应用ReLu以保持网络中的非线性。您能否告诉我如何做到这一点?我的方法是否正确? (1)我尝试将两个图层的sigmoid作为激活函数应用(2)然后我将ReLU激活应用于函数。这两种方法都是失败的。

    0热度

    1回答

    我一直试图在Python 3.6创建香草3层RNN,但每当我训练它的训练迭代的第一个X量训练损失减小后上升和下降零星我无法确定问题。我现在不想使用Tensorflow或Keras或任何深度学习框架,因为我试图更好地了解这些NN如何工作。 我敢肯定我的问题在于无论是在路上,我在我前进的道具功能添加的矩阵合在一起,或者在我的backprop功能我得到错误和权重更新一部分,所以我会后他们都在下面。 很抱