代码收藏家技术教程 2023-07-22

解决RuntimeError: 输入大小为68076的形状“[-1, 784]”无效

在应用torch进行测试时，有可能出现这种错误：

RuntimeError: shape '[-1, 784]' is invalid for input of size 68076

这个错误通常是由于输入数据的大小与模型期望的输入大小不匹配导致的。具体地说，在这个错误信息中，[-1, 784] 表示输入张量的形状是一个二维张量，第一个维度大小是 -1，第二个维度大小是 784，其中 -1 表示这个维度的大小是不确定的，而第二个维度大小为 784 表示每个样本有 784 个特征。而 "input of size 68076" 表示输入张量的总大小是 68076，与期望的大小不匹配。

为了解决这个错误，可以需要检查输入数据的形状和大小是否与模型期望的输入匹配。可能的原因包括：

输入数据的形状或大小不正确。检查输入数据的形状和大小，确保它们与模型期望的输入匹配。如果使用的是预处理后的数据，请确保预处理步骤正确。
模型期望的输入大小不正确。检查模型定义，确保模型期望的输入大小与实际输入数据的大小匹配。可以使用模型的 input_shape 属性或 summary() 方法来查看模型期望的输入大小。
输入数据的格式不正确。确保输入数据的格式正确。例如，在使用图像数据训练模型时，需要将图像转换为正确的格式（如 RGB 或灰度图像）并将其缩放到正确的大小。

问题复现：

import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms

# 定义神经网络
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(784, 128)    #(1*28*28, 128)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(128, 10)    #(-1, 1*28*28)

    def forward(self, x):
        x = x.view(-1, 784)
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

# 加载 MNIST 数据集
transform = transforms.Compose([transforms.ToTensor(),
                                transforms.Normalize((0.1307,), (0.3081,))])
trainset = torchvision.datasets.MNIST(root='./data', train=True,
                                      download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32,
                                          shuffle=True, num_workers=2)

# 定义模型和优化器
net = Net()
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(net.parameters(), lr=0.01, momentum=0.9)

# 训练模型
for epoch in range(5):
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
        optimizer.zero_grad()
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if i % 1000 == 999:
            print('[%d, %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 1000))
            running_loss = 0.0