目次

10. Kuzushiji-MNIST

10.1 データセットの説明

Kuzushiji-MNIST[18]-[21]は日本の古典からとったひらがなのくずし字のデータセットです。
以下の10字を同数含んでいます。
 お, き, す, つ, な, は, ま, や, れ, を
60000個の訓練データと10000個テストデータから成ります。
各データは28x28ピクセルのモノクロ画像です。
図10-1にテストデータの各文字の最初の20個の画像を示します。
現在使われていない変体仮名[22](1900年の学校令で廃止されたひらがな)が多数含まれています。
したがって、複数の字体が同じ回答になるという特徴があります。

図10-1 データセット(テストデータ)

10.2 計算条件の考察

10.2.1 自作CNN

図10-2に自作CNNの正解率を示します。
CNN6とCNN8はほぼ同じであり、CNN4より勝ります。

図10-2 自作CNNの正解率(Adam, 前処理なし, ドロップアウト0.3, ミニバッチ50)

10.2.2 その他のモデル

図10-3にその他のモデルの正解率を示します。
自作ResNetの正解率がその他のモデルよりより少し高くなり、自作CNNと同等です。

図10-3 その他のモデルの正解率

10.3 計算結果

図10-4にテスト結果を示します。テストデータは最初の600個です。 赤字は上が正解、下が誤回答です。




図10-4 テスト結果

図10-5に不正解回答のすべてを示します。

図10-5 不正解回答(152個)

図10-6にラベル別の正解率を示します。"な,す"の正解率が低いことがわかります。

図10-6 ラベル別の正解率