3. 深層学習の方法

3.1 データセット

● データセット
ランダムにとった多数のアンテナ形状をモーメント法またはFDTD法で計算することによって、図3-1のように、遠方界、近傍界、入力インピーダンスの3つのアンテナ特性が得られます。これらの集合をデータセットと呼びます。
なお、本章の計算計算はモーメント法によるものですが、FDTD法でもほぼ同じです。

● アンテナ形状
図3-2にアンテナ形状の一例を示します。上の数字はデータ番号とアンテナセル数です。アンテナセル確率が0.5なのでアンテナセル数は平均的に10x10x0.5=50個あります。なお、アンテナ形状の組み合わせ数は2¹⁰⁰≈10³⁰です。

● 遠方界
図3-3に遠方界の一例を示します。図中の値は sinθ√(|E_θ|²+|E_φ|²) です。上の数字はデータ番号と最大値です。遠方界については学習時の損失を考慮して立体角sinθをかけています。したがって上辺と下辺では0となります。

● 近傍界
図3-4に近傍界の一例を示します。図中の値は √(|E|²+|ηH|²) です。上の数字はデータ番号と最大値です。近傍界については学習時に電界と磁界のオーダーを同じにするために、磁界に真空の波動インピーダンスη(=120πΩ)をかけています。

● 入力インピーダンス
図3-5に入力インピーダンスの頻度分布、図3-6に入力インピーダンス平均とアンテナ高の関係を示します。
入力インピーダンスはアンテナ高Hと線分の半径rに依存します。アンテナ高がλ/4に近いときに入力インピーダンスは純抵抗になりやすい傾向があります。

図3-5 入力インピーダンスの頻度分布(50,000データ, H=20mm, r=2mm)

図3-6 入力インピーダンス平均とアンテナ高の関係(10,000データの平均, r=2mm)

3.2 深層学習

3.2.1 深層学習モデル

深層学習には画像認識に適しているCNN（畳み込みニューラルネットワーク）を使用します。ニューラルネットワークとして軽量で精度のよいResNetを用います。
図3-7のように同じアンテナ形状から遠方界、近傍界、入力インピーダンスの三つを別々に学習します。

3.2.2 損失関数

損失関数はそれぞれ式(3-1),(3-2),(3-3)とします。ここで式(3-1)のEは複素数スカラー、式(3-2)のEとHは複素数ベクトル、式(3-3)のZ_inは複素数スカラーです。したがって成分数はそれぞれ4,12,2となります。

(3-1)
(3-2)
(3-3)
(3-4)

3.2.3 アンテナ形状の拡大

ニューラルネットワークの入力はアンテナ形状であり、図3-2のような白黒2値ですがこれを0-1の実数に変換します。さらに前処理として画素数の拡大(resize)を行うとモデルの性能が上がることが知られています。
図3-8はResNet18/34/50においてresizeの大きさを変えたときの遠方界損失の収束状況です。図からResNet34のresize112/224のときに損失が最小になることがわかります。

図3-9にモデルとresizeと計算時間の関係を示します。これからネットワークの層数が増えたり、 resizeが大きくなると計算時間が増えることがわかります。

図3-9 モデルとresizeと計算時間の関係（遠方界, データ数=20,000, 1エポック）

図3-10にモデルとresizeと使用メモリーの関係を示します。計算時間と同様の傾向があります。なおミニバッチを使用しているために、使用メモリーはデータ数と無関係です。

3.2.4 ミニバッチサイズ

図3-11にミニバッチサイズと損失、使用メモリー、計算時間の関係を示します。ミニバッチサイズ=60との相対比を示しています。図からミニバッチサイズが大きくなると、使用メモリーが増え、計算時間が短くなることがわかります。損失はミニバッチサイズにあまり依存しません。以上からミニバッチサイズ=60を採用します。

図3-11 ミニバッチサイズと損失、使用メモリー、計算時間の関係（遠方界, ResNet34, resize112, データ数=20,000, 20エポック）

3.2.5 学習データのバイト数

学習データの内訳とそのデータ数は以下の通りです。（N:データ数, N_f:周波数数）
遠方界はE_θ,E_φの複素数2成分、近傍界はEx,Ey,Ez,Hx,Hy,Hzの複素数6成分です。

アンテナ形状: N × A_y × A_z
遠方界: N × N_f × N_θ × N_φ × 4
近傍界: N × N_f × N_y × N_z × 12
入力インピーダンス: N × N_f × 2

学習データの大部分は遠方界と近傍界が占めます。バイト数を減らしてファイルサイズを小さくすることができます。図3-12はバイト数を変えたときの遠方界の損失です。これからバイト数による影響は小さいと言えます。以上から遠方界と近傍界のバイト数は1とします。
なお、アンテナ形状は1バイト、入力インピーダンスは4バイトとします。

図3-12 学習データのバイト数と損失の関係（遠方界, ResNet34, resize112, データ数=20,000）

3.2.6 モデルとパラメーター数

表3-1にモデルごとのパラメーター数を示します。パラメーター数は、データ数、resize、ミニバッチサイズに依存しません。

表3-1 パラメーター数
モデル	パラメーター数
ResNet18	14,453,440
ResNet34	24,561,600
ResNet50	36,615,360

3.2.7 深層学習の条件

以上から、計算精度、計算時間、使用メモリーを考慮して深層学習の条件は表3-2とします。

表3-2 深層学習の条件
条件	値
モデル	ResNet34
resize	112
損失関数	MSELoss
最適化関数	Adam
エポック数	20
ミニバッチサイズ	60
ラベルバイト数	1