目次

3.7 計算時間のまとめ

3.7.1 計算時間

表3-7-1に各手法の計算時間をまとめます。
ハードウェアの詳細は3.2の通りです。
CPUではOpenMPまたはMPIによる並列化で約2~3倍速くなります。
GPUではそれよりさらに約4倍速くなります。
CPU、GPUともに使用メモリーの少ないnomatrixモードを推奨します。

表3-7-1 各手法の計算時間(ベンチマーク200共通)
ハードウェア高速化手法計算時間出所
nomatrixmatrix
CPU(参考)並列化なし1066秒859秒表3-3-1
CPUOpenMP 8スレッド 377秒385秒表3-3-1
CPUMPI 8プロセス 389秒413秒表3-4-1
GPUCUDA 108秒メモリー不足表3-6-1
GPU(H100)CUDA 17秒 15秒新規

3.7.2 計算時間の内訳

計算時間の内訳は図3-7-1の通りです。
CPUではnomatrixモードでは行列ベクトル積の時間が増えるのでその比率が上がります。
GPUではその比率はあまり上がりません。
なお、ベクトル演算の計算時間はmatrixモードとnomatrixモードで同じです。


(a) matrixモード

(b) nomatrixモード
図3-7-1 計算時間の内訳