目次

9. FashionMNIST

9.1 データセットの説明

FashionMNIST[17]はファッション商品の画像のデータセットです。
商品名は以下の10通りです。
 Tshirt/top, Trouser, Pullover, Dress, Coat, Sandal, Shirt, Sneaker, Bag, AnkleBoot
60000個の訓練データと10000個のテストデータから成ります。
各データは28x28ピクセルのモノクロ画像です。
図9-1にテストデータの各種類の最初の20個の画像を示します。
人間の正解率は83.5%と言われています([17]の"Human Performance")。

図9-1 データセット(テストデータ)

9.2 計算条件の考察

9.2.1 自作CNN

図9-2に自作CNN6の正解率を示します。
ドロップアウト確率を0.3から0.6にすると過学習は抑えられますが。 最終的な正解率には有意な差は見られません。

図9-2 自作CNNの正解率(実線:正解率, 破線:損失, CNN6, 128ch, Adam, 前処理なし, ミニバッチ50)

9.2.2 その他のモデル

図9-3にその他のモデルの正解率を示します。
ResNet18(重みあり)は他の2つより約1%高く、自作CNNより少し高くなっています。

図9-3 その他のモデルの正解率

9.3 計算結果

図9-4にテスト結果を示します。テストデータは最初の200個です。 赤字は上が正解、下が誤回答です。

図9-4 テスト結果

図9-5に不正解回答の最初の200個を示します。

図9-5 不正解回答

図9-6にラベル別の正解率を示します。"Shirt"の正解率が低くなっています。

図9-6 ラベル別の正解率