目次

3.7 計算時間のまとめ

3.7.1 計算時間

表3-7-1に各手法の計算時間をまとめます。
ハードウェアの詳細は3.2の通りです。
CPUではOpenMPまたはMPIによる並列化で約3~4倍速くなります。
GPUではそれよりさらに約4~5倍速くなります。
CPU、GPUともに使用メモリーの少ないnomatrixモードを推奨します。

表3-7-1 各手法の計算時間(ベンチマーク200共通)
ハードウェア高速化手法計算時間出所
nomatrixmatrix
CPU(参考)並列化なし1121秒729秒 表3-3-1
CPUOpenMP 8スレッド 277秒273秒 表3-3-1
CPUMPI 8プロセス 319秒286秒 表3-4-1
GPUCUDA 61秒メモリー不足表3-6-1
GPU(H100)CUDA 17秒 15秒 新規

3.7.2 計算時間の内訳

計算時間の内訳は図3-7-1の通りです。
CPUではnomatrixモードでは行列ベクトル積の時間が増えるのでその比率が上がります。
GPUではその比率はあまり上がりません。
なお、ベクトル演算の計算時間はmatrixモードとnomatrixモードで同じです。


(a) matrixモード

(b) nomatrixモード
図3-7-1 計算時間の内訳