MNIST 数据集是机器学习和深度学习领域中最常用的数据集之一,它包含了大量的手写数字图片。本教程将介绍 MNIST 数据集的基本信息和使用方法。

MNIST 数据集概述

MNIST 数据集包含了 60,000 个训练样本和 10,000 个测试样本,每个样本都是一个 28x28 的灰度图像,表示一个手写数字(0-9)。这些图像是由美国国家标准与技术研究院(NIST)提供的。

使用 MNIST 数据集

以下是如何在 Python 中加载和使用 MNIST 数据集的示例:

from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten


(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 构建模型
model = Sequential()
model.add(Flatten(input_shape=(28, 28)))
model.add(Dense(128, activation='relu'))
model.add(Dense(10, activation='softmax'))

# 编译模型
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 训练模型
model.fit(x_train, y_train, epochs=5)

# 评估模型
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print('\nTest accuracy:', test_acc)

扩展阅读

如果您想了解更多关于 MNIST 数据集的信息,可以阅读以下文章:

MNIST 数据集示例图片