1. MNIST データセット とは
MNIST データセットとは,Yann LecunらによるLeNetの研究開発において「手書き数字画像のクラス識別」に用いられ,のちにオープン化されたデータセットである.よって,MNIST Database という名前は,Modified (M) National Institute of Standards and Technology(NIST) 」Database の略称である.米国商務省の研究所であるNIST( Wikipedia )が所有していたデータセットを整形し,修正して一般公開された.
- MNIST Dataset | Paper With Code
- MNIST database – Wikipedia
2. MNISTの構成
MNIST データセットは,28 × 28 のサイズの,一桁の手書き数字(0~9)を撮影したグレー画像と,そのクラスラベルから構成されている.また,学習用画像60,000枚と,テスト用画像10,000枚で構成される.
MNISTは画像認識目的のディープラーニング・CNNでは,基本中の基本のデータセットである.それもあって,PytorchやTensorflowなどの汎用的なdeep learningライブラリでは,MNISTをロードしたり,サーバからダウンロードできるクラスメソッドが予め用意されている(よって,自前でホームページからMNISTをダウンロードして使用することはしない).
3. MNISTの使用先
初期は,LeNetのように,CNNを用いたクラス識別ネットワークの学習目的に使われていたが,Deep Boltmanz Machineや,オートエンコーダなど深層生成モデルの初期の基礎研究でもMNISTは用いられ,その後も,GANやVAEなどの初期研究なども,まずMNISTで試されている.これは,MNIST データセットが「小さい画像で少数のクラスから構成され,かつグレー画像である」ので,規模感が小さく,小規模の基礎実験を試しやすいという利点による.「手書き数字」という対象が,クラスごとの見え方の連続的な変化を,可視化時に把握しやすいので,よく深層生成モデルの基礎実験に用いられると言える.
その後も,画像生成や画像対画像変換でも,新しいモデルの新規提案時に予備実験的や基礎実験的な目的でいまも使われ続けているデータセットである.画像サイズが小さい他のデータセットも,同様の目的や意図で使われることが多い.
関連書籍
- 物体・画像認識と時系列データ処理入門 [TensorFlow2/PyTorch対応第2版] NumPy/TensorFlow2(Keras)/PyTorchによる実装ディープラーニング, チーム・カルポ、秀和システム,2021.
- 5, 6章でMNIST とFashion-MNISTを使って識別器を学習する.
- Advanced Deep Learning with TensorFlow 2 and Keras: Apply DL, GANs, VAEs, deep RL, unsupervised learning, object detection and segmentation, and more, 2nd Edition , Rowel Atienza, Packet publishing, 2020.