MNIST 数据集是一个手写数字的图像数据集,包含 60,000 个训练样本和 10,000 个测试样本。本教程将为您介绍如何使用 TensorFlow 构建一个简单的手写数字识别模型。
数据集介绍
MNIST 数据集包含了 0 到 9 这十个数字的 28x28 像素灰度图像。以下是数据集的一个示例图片:
步骤
导入 TensorFlow 库
首先,我们需要导入 TensorFlow 库以及其他必要的库。import tensorflow as tf from tensorflow.keras.datasets import mnist from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Dropout, Flatten from tensorflow.keras.layers import Conv2D, MaxPooling2D
加载数据集
使用mnist.load_data()
函数加载数据集。(x_train, y_train), (x_test, y_test) = mnist.load_data()
数据预处理
为了更好地训练模型,我们需要对数据进行预处理。具体包括归一化和形状调整。x_train, x_test = x_train / 255.0, x_test / 255.0 x_train = x_train.reshape(x_train.shape[0], 28, 28, 1) x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
构建模型
下面是一个简单的卷积神经网络模型,用于识别手写数字。model = Sequential() model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1))) model.add(Conv2D(64, (3, 3), activation='relu')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Dropout(0.25)) model.add(Flatten()) model.add(Dense(128, activation='relu')) model.add(Dropout(0.5)) model.add(Dense(10, activation='softmax')) model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
训练模型
使用训练数据对模型进行训练。model.fit(x_train, y_train, batch_size=128, epochs=10, verbose=1, validation_data=(x_test, y_test))
评估模型
使用测试数据评估模型的准确率。score = model.evaluate(x_test, y_test, verbose=0) print('Test loss:', score[0]) print('Test accuracy:', score[1])
更多关于 TensorFlow 和机器学习的内容,请访问我们的 机器学习教程 页面。