パフォーマンス改善¶
複数の時間ステップに対応¶
二段階の多時間ステップスキームが実装されました。5つの異なるフォースグループの任意の組み合わせを選択して評価することで、パフォーマンスが向上します。
GPU版のアップデートと制約に関するサポート対象ユースケースの拡張¶
GPU版のアップデートと制約は、質量と制約のない自由エネルギー計算を除くFEP(分子動力学シミュレーション)で使用できるようになりました。
「gromppでの処理時間を、多数の距離制約を使用した場合に短縮する」¶
gmx grompp で距離制約を処理するのにかかる時間が、制約の数に応じて二乗になるのではなく、線形になるように変更されました。
コクーレンFEPを実行する際に、PMEの計算をGPUにオフロードするためのサポート¶
コクーロン自由エネルギーの摂動を行う際に、PME計算をGPUにオフロードできます。
CPUでSIMD命令を利用した調和結合の最適化実装¶
SIMDによるバインディングの最適化により、H-結合のみが制限されている、または結合が制限されていないシステムにおいて、わずかにパフォーマンスが向上します。これにより、複数の時間ステップで大幅な改善が見られます。
GPUのアップデートと制約を直接のGPUとの通信なしでオフロードできるようにする¶
ドメイン分割とPMEの並列実行をGPU(CUDAを使用)にオフロードし、更新と制約をGPUに割り当てることを可能にします。これにより、(実験的な)直接的なGPU通信機能が有効になっている必要はなくなります。
NVIDIA VoltaおよびAmpere A100におけるCUDAの近距離非相互作用カーネルパラメータの調整¶
最近のコンパイラでは、NVIDIA VoltaおよびAmpere A100 GPUで非相互作用カーネルのデフォルト設定を再調整できるようになり、これによりEwaldカーネルのパフォーマンスが向上します。特に、エネルギーも計算するカーネルのパフォーマンスが向上します。