1
给NotImplementedError()这怎么可能,它的作品T.hessian在theano
g_W = T.grad(cost=cost, wrt=classifier.vparamW)
,而这
H_W=T.hessian(cost=cost, wrt=classifier.vparamW)
给NotImplementedError() 可能它是在这样的成本函数问题:
-T.mean(T.log(self.p_y_given_x)[T.arange(y.shape[0]), y])
这里y是从0到n-1的类标签向量,
self.p_y_given_x = T.nnet.softmax(T.dot(input, self.W) + self.b)