TensorFlow Datasets 是 TensorFlow 的一部分,提供了大量经过预处理的、用于机器学习和深度学习的数据集。以下是一些关于 TensorFlow Datasets 的基本信息和资源链接。
安装
要安装 TensorFlow Datasets,请确保您已经安装了 TensorFlow。然后,使用以下命令进行安装:
pip install tensorflow-datasets
数据集列表
TensorFlow Datasets 提供了多种数据集,以下是一些常用的数据集:
- CIFAR-10:一个包含 10 个类别的 60,000 张 32x32 彩色图像的数据集。
- MNIST:一个包含 60,000 个训练样本和 10,000 个测试样本的数字手写体数据集。
- IMDb:一个用于情感分析的包含 50,000 条评论的数据集。
示例
以下是一个使用 TensorFlow Datasets 加载 CIFAR-10 数据集的示例:
import tensorflow_datasets as tfds
(train_data, test_data), info = tfds.load('cifar10', split=['train', 'test'], with_info=True)
相关链接
CIFAR-10 数据集示例