パフォーマンス改善¶

複数の時間ステップに対応¶

二段階の多時間ステップスキームが実装されました。5つの異なるフォースグループの任意の組み合わせを選択して評価することで、パフォーマンスが向上します。

GPU版のアップデートと制約は、質量と制約のない自由エネルギー計算を除くFEP（分子動力学シミュレーション）で使用できるようになりました。

gmx grompp で距離制約を処理するのにかかる時間が、制約の数に応じて二乗になるのではなく、線形になるように変更されました。

コクーロン自由エネルギーの摂動を行う際に、PME計算をGPUにオフロードできます。

SIMDによるバインディングの最適化により、H-結合のみが制限されている、または結合が制限されていないシステムにおいて、わずかにパフォーマンスが向上します。これにより、複数の時間ステップで大幅な改善が見られます。

ドメイン分割とPMEの並列実行をGPU（CUDAを使用）にオフロードし、更新と制約をGPUに割り当てることを可能にします。これにより、(実験的な)直接的なGPU通信機能が有効になっている必要はなくなります。

最近のコンパイラでは、NVIDIA VoltaおよびAmpere A100 GPUで非相互作用カーネルのデフォルト設定を再調整できるようになり、これによりEwaldカーネルのパフォーマンスが向上します。特に、エネルギーも計算するカーネルのパフォーマンスが向上します。