pytorch

    -1热度

    1回答

    我试图建立一个与Pytorch的cnn,并在maxpooling困难。我拿走了斯坦福大学的cs231n。正如我回忆,maxpooling可以用作尺寸扣除步骤,例如,我有(1,20,高度,宽度)输入ot max_pool2d(假设我的batch_size为1)。如果我使用(1,1)内核,我想得到这样的输出:(1,1,height,width),这意味着内核应该滑过通道维度。但是,在检查pytorch

    0热度

    1回答

    任何帮助将不胜感激。 transforms.py中的代码表示转换应该适用于PIL图像以及ndarrays。 鉴于变换: data_transforms = { 'train': transforms.Compose([ transforms.Scale(256), transforms.Pad(4,0), transforms.ToTensor(),

    1热度

    1回答

    这可能看起来像一个基本问题,但我无法完成。 在我神经网络的正向传递中,我有一个形状为8x3x3的输出张量,其中8是我的批量大小。我们可以假设每个3×3张量是一个非奇异矩阵。我需要找到这些矩阵的逆。 PyTorch inverse()函数仅适用于矩形矩阵。由于我现在有8x3x3,我该如何将此函数以可微分的方式应用于批处理中的每个矩阵? 如果我遍历样本并将逆向追加到一个python列表中,然后我将其转

    0热度

    1回答

    我正在用Pytorch试验Autoencoder。当我使用比较大的神经网络例如nn.Linear(250 * 250,40 * 40)作为第一层时,Jupyter内核不断崩溃。当我使用较小的图层大小时线性(250 * 250,20 * 20)。 Jupyter内核是可以的。任何想法如何解决这个问题?所以我可以运行更大的网络。谢谢。整个网络如下。 # model: class AutoEncode

    1热度

    1回答

    我有一个让我困惑,我希望把它清除掉一些PyTorch例子。 首先,按照PyTorch页,我希望这些例子工作,因为做自己numpy的等价物即these。第一个例子非常直观。这些广播是兼容的: Image (3d array): 256 x 256 x 3 Scale (1d array): 3 Result (3d array): 256 x 256 x 3 就拿这些: torch.T

    3热度

    1回答

    我正在尝试为奥赛罗构建一个时间差异学习代理。虽然我的其他实现似乎按预期运行,但我想知道用于训练我的网络的损失函数。在Sutton的“增强学习:导论”一书中,均方误差值(MSVE)是标准损失函数,它基本上是一个均方误差乘以策略分布(所有状态之和(onPolicyDistribution(s )* [V(s)-V'(s,w)] 2)) 我现在的问题是:当我的策略是学习值函数的e-greedy函数时,如

    0热度

    1回答

    当我运行下面的代码时,变量类型变成了torch.LongTensor。我怎样才能创建一个torch.cuda.LongTensor而不是? # Turn string into list of longs def char_tensor(string): tensor = torch.zeros(len(string)).long() for c in range(len(s

    0热度

    1回答

    我想在pytorch中使用预先训练好的ResNet模型来计算正向通行证。我无法创建小批量的4维张量。有人可以告诉什么是适当的方式来做到这一点? 编辑:我改变了代码,它现在的作品。不过,我仍然认为应该采取更有效的方式来做到这一点。 这里是我的代码: import pickle import json import shutil import Image import torchvision.

    1热度

    1回答

    在从https://github.com/spro/practical-pytorch/blob/master/seq2seq-translation/seq2seq-translation.ipynb 教程有一个USE_CUDA标志被用于控制CPU之间的变量和张量类型(假时)到GPU(当真)类型。 从en-fr.tsv使用数据和转换的判决变量: import unicodedata impor

    0热度

    1回答

    训练时我无法弄错我做错了RNN。我试图训练RNN对于和序列操作(了解它如何在简单的任务上工作)。 但是我的网络没有学习,损失保持不变,并且它不能模拟事件。 你能帮我找到问题吗? 数据我使用: data = [ [1, 1, 1, 1, 0, 0, 1, 1, 1], [1, 1, 1, 1], [0, 0, 1, 1], [0, 0, 0, 0, 0, 0,