本文将带你入门使用 PyTorch 进行卷积神经网络(CNN)的构建和训练。我们将从基础概念开始,逐步深入到模型构建、训练和评估。

1. 引言

卷积神经网络(CNN)是深度学习领域中一种重要的模型,尤其在图像识别、图像分类等领域表现优异。PyTorch 是一个流行的深度学习框架,以其简洁易用的特点受到了广泛欢迎。

2. 基础概念

在开始构建 CNN 之前,我们需要了解一些基本概念:

  • 卷积层(Convolutional Layer):卷积层是 CNN 的核心,用于提取图像特征。
  • 激活函数(Activation Function):激活函数用于引入非线性,使得网络能够学习更复杂的模式。
  • 池化层(Pooling Layer):池化层用于降低特征图的空间维度,减少计算量。

3. PyTorch CNN 构建步骤

以下是使用 PyTorch 构建 CNN 的一般步骤:

  1. 导入必要的库

    import torch
    import torch.nn as nn
    import torch.optim as optim
    
  2. 定义网络结构

    class CNN(nn.Module):
        def __init__(self):
            super(CNN, self).__init__()
            self.conv1 = nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1)
            self.conv2 = nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1)
            self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
            self.fc1 = nn.Linear(64 * 7 * 7, 128)
            self.fc2 = nn.Linear(128, 10)
            self.relu = nn.ReLU()
    
        def forward(self, x):
            x = self.pool(self.relu(self.conv1(x)))
            x = self.pool(self.relu(self.conv2(x)))
            x = x.view(-1, 64 * 7 * 7)
            x = self.relu(self.fc1(x))
            x = self.fc2(x)
            return x
    
  3. 初始化模型、损失函数和优化器

    model = CNN()
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
    
  4. 训练模型

    for epoch in range(2):  # loop over the dataset multiple times
        running_loss = 0.0
        for i, data in enumerate(train_loader, 0):
            inputs, labels = data
            optimizer.zero_grad()
            outputs = model(inputs)
            loss = criterion(outputs, labels)
            loss.backward()
            optimizer.step()
            running_loss += loss.item()
            if i % 2000 == 1999:    # print every 2000 mini-batches
                print('[%d, %5d] loss: %.3f' %
                      (epoch + 1, i + 1, running_loss / 2000))
                running_loss = 0.0
    print('Finished Training')
    
  5. 评估模型

    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_loader:
            images, labels = data
            outputs = model(images)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
    print('Accuracy of the network on the 10000 test images: %d %%' % (
        100 * correct / total))
    

4. 扩展阅读

更多关于 PyTorch 和 CNN 的信息,您可以参考以下资源:

5. 总结

本文介绍了使用 PyTorch 构建 CNN 的基本步骤。通过阅读本文,您应该能够理解 CNN 的工作原理,并开始构建自己的模型。

希望本文对您有所帮助!🌟


CNN模型结构图

希望这个教程对您有所帮助!如果您有任何疑问,欢迎在评论区留言。👇