TensorFlow Datasets 是 TensorFlow 的一部分,提供了大量经过预处理的、用于机器学习和深度学习的数据集。以下是一些关于 TensorFlow Datasets 的基本信息和资源链接。

安装

要安装 TensorFlow Datasets,请确保您已经安装了 TensorFlow。然后,使用以下命令进行安装:

pip install tensorflow-datasets

数据集列表

TensorFlow Datasets 提供了多种数据集,以下是一些常用的数据集:

  • CIFAR-10:一个包含 10 个类别的 60,000 张 32x32 彩色图像的数据集。
  • MNIST:一个包含 60,000 个训练样本和 10,000 个测试样本的数字手写体数据集。
  • IMDb:一个用于情感分析的包含 50,000 条评论的数据集。

示例

以下是一个使用 TensorFlow Datasets 加载 CIFAR-10 数据集的示例:

import tensorflow_datasets as tfds

(train_data, test_data), info = tfds.load('cifar10', split=['train', 'test'], with_info=True)

相关链接

CIFAR-10 数据集示例