MNIST 数据集是一个手写数字的图像数据集,包含 60,000 个训练样本和 10,000 个测试样本。本教程将为您介绍如何使用 TensorFlow 构建一个简单的手写数字识别模型。

数据集介绍

MNIST 数据集包含了 0 到 9 这十个数字的 28x28 像素灰度图像。以下是数据集的一个示例图片:

digit sample

步骤

  1. 导入 TensorFlow 库
    首先,我们需要导入 TensorFlow 库以及其他必要的库。

    import tensorflow as tf
    from tensorflow.keras.datasets import mnist
    from tensorflow.keras.models import Sequential
    from tensorflow.keras.layers import Dense, Dropout, Flatten
    from tensorflow.keras.layers import Conv2D, MaxPooling2D
    
  2. 加载数据集
    使用 mnist.load_data() 函数加载数据集。

    (x_train, y_train), (x_test, y_test) = mnist.load_data()
    
  3. 数据预处理
    为了更好地训练模型,我们需要对数据进行预处理。具体包括归一化和形状调整。

    x_train, x_test = x_train / 255.0, x_test / 255.0
    x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
    x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
    
  4. 构建模型
    下面是一个简单的卷积神经网络模型,用于识别手写数字。

    model = Sequential()
    model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)))
    model.add(Conv2D(64, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))
    model.add(Flatten())
    model.add(Dense(128, activation='relu'))
    model.add(Dropout(0.5))
    model.add(Dense(10, activation='softmax'))
    
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    
  5. 训练模型
    使用训练数据对模型进行训练。

    model.fit(x_train, y_train, batch_size=128, epochs=10, verbose=1, validation_data=(x_test, y_test))
    
  6. 评估模型
    使用测试数据评估模型的准确率。

    score = model.evaluate(x_test, y_test, verbose=0)
    print('Test loss:', score[0])
    print('Test accuracy:', score[1])
    

更多关于 TensorFlow 和机器学习的内容,请访问我们的 机器学习教程 页面。