メイン コンテンツにスキップ

 Subscribe

今すぐライブプレビュー、すぐに世界中で利用可能

AMD 3D V キャッシュを搭載した第 3 世代 AMD EPYC™ プロセッサによって強化された Azure HBv3 仮想マシンのプレビューが公開され、"Milan-X" というコード名が付けられます。これらのプロセッサは、CFD、明示的な有限要素分析、計算地球科学、気象シミュレーション、シリコン設計 RTL ワークフローなど、さまざまなメモリ パフォーマンスバインド ワークロードのパフォーマンス、スケーリング効率、およびコスト効率を大幅に向上させます。

第 3 世代 AMD EPYC プロセッサを搭載した現在の HBv3 シリーズと比較して、既 にパブリック クラウド上の HPC ワークロード 用の最高パフォーマンス VM であるお客様は、次の操作を行います。

  • CFD のパフォーマンスが 80% 向上
  • EDA RTL のパフォーマンスが 60% 向上
  • 明示的な FEA のパフォーマンスが 50% 向上
  • 気象シミュレーションのパフォーマンスが 19% 向上

さらに、世界中のすべての HBv3 シリーズ VM は、近日中に Milan-X プロセッサを使用してアップグレードされます。このアップグレードは、HBv3 シリーズ VM の既存の価格を超える追加コストなしで提供され、お客様のワークロードに変更は必要ありません。HBv3 シリーズの VM サイズに対して、お客様が既に知っており、重要な調査とビジネス ワークロードに依存しているその他の変更はありません。Azure HBv3 シリーズの詳細については、公式ドキュメントを参照してください。

メモリ パフォーマンスにバインドされた HPC ワークロードのターボチャージ

多くの HPC ワークロードは、メモリパフォーマンスによって最も重要です。計算流体力学などの一部の場合、パフォーマンスはメモリ帯域幅によって直接駆動されます。シリコン設計会社のワークホース アプリケーションである RTL シミュレーションなど、他のユーザーの場合は、メモリ待機時間を意味します。HBv3 シリーズ VM への今後のアップグレードでは、L3 キャッシュ メモリを仮想マシンあたり前例のない 1.5 ギガバイトに増やすことによって、両方のニーズに対応します。これは、現在 HBv3 シリーズ VM にある標準の 3rd Gen EPYC プロセッサの 3 倍の大きい値であり、現在の顧客データセンターのほとんどの HPC サーバーで見つかった合計 L3 キャッシュの 25 倍以上です。

メモリ帯域幅にバインドされたワークロードを適切なスケールで実行する場合、L3 キャッシュが大きくなると、有効なメモリ帯域幅が最大 1.8 倍増加します。つまり、現在 350 GB/秒 (STREAM-TRIAD で測定) を提供している HBv3 VM は、600 GB/秒を超えるメモリ帯域幅を持つ VM のようにすぐに実行されます。

メモリ待機時間にバインドされたワークロードの場合、Milan-X プロセッサの L3 キャッシュが大きくなると、キャッシュ ヒット 率が最大で 50% 増加し、全体的なキャッシュ待機時間の範囲 (1 つのコアから最も近い最も近い近隣コアまでの待機時間) が生じます。逆に、標準の 3rd Gen EPYC プロセッサよりも 50% 低くなります。

以下は、Azure HBv3 VM をミラノ X プロセッサで強化した大規模なパフォーマンスの結果のサンプルです。これは、標準の 3rd Gen EPYC プロセッサを搭載した既存の HBv3 シリーズと比較したものです。テストは、2 から 64 個の VM (240 から 7,680 CPU コア) までのさまざまな MPI スケール シナリオで実施されました。

An image of Relative HPC Performance showcasing a bar chart where benchmarks were taken with WRF v. 4.15, OpenFOAM v. 1912, and Ansys Fluent 2021 R1

図 1: ベンチマークは WRF v 4.15、OpenFOAM v. 1912、および Ansys Fluent 2021 R1 で取得されました

パフォーマンスとスケーラビリティに関する 追加情報について説明します

スケーリングが多いほど、支払いは少なくなります。...いや本当です

NVIDIA のパートナーが Azure で NVIDIA Quantum InfiniBand Networking を使用することで、お客様は MPI ワークロードをスーパーコンピューターの高さにスケーリングできます。HBv3 シリーズ VM の Milan-X プロセッサでは、さまざまな MPI ワークロードとモデルで線形スケーリング効率を上げることで、もう一度バーを上げます。つまり、 お客様は、ソリューションまでの時間を大幅に短縮した結果、Azure コンピューティング コストを実際に節約できます。Ansys Fluent と正規のF1_racerar_140m シミュレーションを使用して実行されるこの機能の例を次に示します。Milan-X プロセッサを搭載した HBv3 VM では、64 個の VM に対してのみ 127 倍のパフォーマンスを実現することで、スケーリング効率が約 200% 向上します。

An image of line chart with an upward trend showing the measured scaling efficiency from 1 to 64 VMs using ANSYS Fluent 2021 R1

図 2: ANSYS Fluent 2021 R1 を使用した 1 台から 64 台の VM へのスケーリング効率の測定

さまざまなアプリケーション、モデル、および構成にわたるパフォーマンスとスケーラビリティに 関する追加情報について説明します

Azure HPC のお客様向けの継続的な改善

Microsoft と AMD は、クラウドにおけるハイパフォーマンス コンピューティングの新時代のビジョンを共有しています。これは、お客様にとって最も重要な重要な研究とビジネス ワークロードの継続的な改善によって定義されます。Azure は AMD と提携し、Azure HB シリーズの仮想マシンのすべてのリリースで提供されるパフォーマンス、スケーラビリティ、価値を高めることで、このビジョンを実現しています。

Azure HPC performance 2019 through 2021

図 3: Azure HPC パフォーマンス 2019 から 2021

Microsoft は、HBv3 シリーズの仮想マシンで近日中にすべての Azure HPC のお客様に Milan-X プロセッサを提供することを楽しみにしています。また、すべてのユーザーがプレビューに参加できることを楽しみにしています。

  • Explore

     

    Let us know what you think of Azure and what you would like to see in the future.

     

    Provide feedback

  • Build your cloud computing and Azure skills with free courses by Microsoft Learn.

     

    Explore Azure learning