DeepSpeedのv0.18.6パッチリリースでは、いくつかの重要な変更が行われました。まず、version.txtが0.18.6に更新され、最新のリリースが反映されています。次に、leafモジュールのレースコンディションが修正され、評価中のシーケンス並列操作がスキップされるようになりました。また、AutoTPのカスタムパーティショニングパターンがサポートされ、Python 3.14のアノテーション処理が新たに対応しました。さらに、deprecatedなfractions.gcdがmath.gcdに置き換えられ、bf16の勾配ノルムの発散がZeROステージ0で修正されました。最後に、torch.jit.scriptがtorch.compileに置き換えられました。 • version.txtが0.18.6に更新された • leafモジュールのレースコンディションが修正された • 評価中のシーケンス並列操作がスキップされるようになった • AutoTPのカスタムパーティショニングパターンがサポートされた • Python 3.14のアノテーション処理が新たに対応した • deprecatedなfractions.gcdがmath.gcdに置き換えられた • bf16の勾配ノルムの発散がZeROステージ0で修正された • torch.jit.scriptがtorch.compileに置き換えられた
DeepSpeedのv0.18.5パッチリリースでは、いくつかのバグ修正と機能改善が行われました。主な変更点には、MPSでの実行に関する修正、Megatron-DeepSpeedチュートリアルの更新、テストワークフローへのタイムアウトの追加、BF16オプティマイザの選択に関する問題の修正が含まれています。また、ZeRO-3のための全体的な最適化や、Evoformerのコンパイル修正も行われました。新しいコントリビューターも数名参加しており、全体的なエンジンのクリーンアップも改善されています。 • MPSでの実行に関するバグ修正 • Megatron-DeepSpeedチュートリアルの更新 • テストワークフローへのタイムアウトの追加 • BF16オプティマイザの選択に関する問題の修正 • ZeRO-3のための全体的な最適化 • Evoformerのコンパイル修正 • 新しいコントリビューターの参加 • エンジンのクリーンアップの改善