Python 手写数字识别
Python 中的手写数字识别是一个常见的机器学习任务,通常使用 MNIST 数据集进行训练。以下是一些关于 Python 手写数字识别的要点:
MNIST 数据集
MNIST 数据集包含了 60,000 个训练样本和 10,000 个测试样本,每个样本都是一个 28x28 的灰度图像,代表一个手写的数字。
常用库
- TensorFlow: TensorFlow 是一个广泛使用的机器学习库,提供了对 MNIST 数据集的直接支持。
- Keras: Keras 是一个高级神经网络 API,可以运行在 TensorFlow、CNTK 和 Theano 上。
示例代码
以下是一个使用 TensorFlow 和 Keras 进行手写数字识别的简单示例:
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten
from tensorflow.keras.layers import Conv2D, MaxPooling2D
(x_train, y_train), (x_test, y_test) = mnist.load_data()
# 数据预处理
x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
input_shape = (28, 28, 1)
# 归一化
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255
# 编码标签
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)
# 构建模型
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=input_shape))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))
# 编译模型
model.compile(loss=tf.keras.losses.categorical_crossentropy, optimizer=tf.keras.optimizers.Adam(), metrics=['accuracy'])
# 训练模型
model.fit(x_train, y_train, batch_size=128, epochs=10, verbose=1, validation_data=(x_test, y_test))
# 评估模型
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])
扩展阅读
想要了解更多关于 Python 机器学习的知识,可以访问本站的 机器学习教程。
MNIST 数据集中的手写数字示例