MNIST データセット

1. MNIST データセット とは

MNIST データセットとは,Yann Lecunらの LeNet の研究開発において「手書き数字画像のクラス識別」に用いられ,のちにオープン化されたデータセットである.米国商務省の研究所であるNIST( Wikipedia )が所有していたデータセットを整形し,修正して一般公開したものである.よって,MNIST Database という名前もそのまま「Modified(修正された) National Institute of Standards and Technology(NISTの)」Database の略称である.

2. MNISTの構成

MNIST データセットは,28 × 28 のサイズの,一桁の手書き数字(0~9)を撮影したグレー画像と,そのクラスラベルから構成されている.また,学習用画像60,000枚と,テスト用画像10,000枚で構成される.

MNISTは画像認識目的のディープラーニング・CNNでは,基本中の基本のデータセットである.それもあって,PytorchやTensorflowなどの汎用的なdeep learningライブラリでは,MNISTをロードしたり,サーバからダウンロードできるクラスメソッドが予め用意されている(よって,自前でホームページからMNISTをダウンロードして使用することはしない).

3. MNISTの使用先

初期は,LeNetのように,CNNを用いたクラス識別ネットワークの学習目的に使われていたが,Deep Boltmanz Machineや,オートエンコーダなど深層生成モデルの初期の基礎研究でもMNISTは用いられ,その後も,GANVAEなどの初期研究なども,まずMNISTで試されている.これは,MNIST データセットが「小さい画像で少数のクラスから構成され,かつグレー画像である」ので,規模感が小さく,小規模の基礎実験を試しやすいという利点による.「手書き数字」という対象が,クラスごとの見え方の連続的な変化を,可視化時に把握しやすいので,よく深層生成モデルの基礎実験に用いられると言える.

その後も,画像生成や画像対画像変換でも,新しいモデルの新規提案時に予備実験的や基礎実験的な目的でいまも使われ続けているデータセットである(画像サイズが小さい他のデータセットも,同様の目的や意図で使われることが多い).

関連記事

関連書籍

SNSでシェアやブックマークを行う