Fashion-MNIST - 替代 MNIST 手写数字集的图像数据集


MIT
跨平台
Python

软件简介

FashionMNIST是一个替代 MNIST 手写数字集的图像数据集。 它是由
Zalando(一家德国的时尚科技公司)旗下的研究部门提供。其涵盖了来自 10 种类别的共
7 万个不同商品的正面图片。FashionMNIST 的大小、格式和训练集/测试集划分与原始的 MNIST 完全一致。60000/10000
的训练测试数据划分,28x28 的灰度图片。你可以直接用它来测试你的机器学习和深度学习算法性能,且 不需要 改动任何的代码。

这个数据集的样子大致如下(每个类别占三行):

为什么要做这个数据集?

经典的 MNIST
数据集
包含了大量的手写数字。十几年来,来自机器学习、机器视觉、人工智能、深度学习领域的研究员们把这个数据集作为衡量算法的基准之一。你会在很多的会议,期刊的论文中发现这个数据集的身影。实际上,MNIST
数据集已经成为算法作者的必测的数据集之一。有人曾调侃道: “如果一个算法在 MNIST 不 work , 那么它就根本没法用;而如果它在 MNIST 上
work , 它在其他数据上也可能不 work !”

Fashion-MNIST 的目的是要成为 MNIST
数据集的一个直接替代品。作为算法作者,你不需要修改任何的代码,就可以直接使用这个数据集。Fashion-MNIST
的图片大小,训练、测试样本数及类别数与经典 MNIST 完全相同