ハイ パフォーマンス コンピューティング用の新しい HBv2 Azure 仮想マシンの概要

2019年8月8日 に投稿済み

Principal Program Manager, Azure HPC

ハイ パフォーマンス コンピューティング (HPC) 用の第 2 世代 HB シリーズ Azure 仮想マシンをご紹介します。HBv2 仮想マシンは、実環境のさまざまな HPC ワークロードに対するリーダー クラスのパフォーマンス、Message Passing Interface (MPI) スケーラビリティ、およびコスト効率を提供するように設計されています。

HBv2 仮想マシンは、120 AMD EPYC™ 7002 シリーズ CPU コア、480 GB RAM、480 MB L3 キャッシュを備え、同時マルチスレッド (SMT) はありません。HBv2 仮想マシンが提供するメモリ帯域幅は最大 350 GB/秒で、これは同等の x86 プラットフォームを 45% から 50% 上回っており、今のほとんどの HPC ユーザーが自分のデータセンターで利用しているものの 3 倍の速度となります。

サイズ CPU コア数 メモリ: GB CPU コアあたりのメモリ: GB ローカル SSD: GiB RDMA ネットワーク Azure ネットワーク
Standard_HB120rs 120 480 GB 4 GB 1.6 TB 200 Gbps 40 Gbps

"r" は RDMA のサポートを表します。"s" は Premium SSD ディスクのサポートを表します。

また、各 HBv2 仮想マシン (VM) が、最大 4 TFLOPS の倍精度性能と、最大 8 TFLOPS の単精度性能も備えています。これは第 1 世代 HB シリーズ仮想マシンの 4 倍で、最速メモリとリーダー クラスのコンピューティング密度を必要とするアプリケーションのパフォーマンスが大幅に改善されています。

一般的な複数の HPC アプリケーションとドメインについて、HBv2 の予備的なベンチマークを次に示します。

相対パフォーマンスの棒グラフ

最適な大規模 Message Passing Interface (MPI) パフォーマンスを実現するために、HBv2 仮想マシンは、テクノロジ パートナー Mellanox の 200 GB/秒 HDR InfiniBand を備えています。HBv2 仮想マシンを支える InfiniBand のファブリックは、ノンブロッキング Fat Tree 型で、Low-Diameter 設計によって一貫した超低待機時間が実現されています。お客様は、標準の Mellanox/OFED ドライバーを、ベアメタル環境で使うのと同じように、使用することができます。HBv2 仮想マシンでは公式に RDMA 動詞がサポートされているため、OpenMPIMVAPICH2プラットフォーム MPIIntel MPI など、InfiniBand ベースの MPI がサポートされています。また、お客様が MPI コレクティブのハードウェア オフロードを利用して、追加パフォーマンスを実現し、商用ライセンスが提供されているアプリケーションの効率を向上させることもできます。

お客様は、1 つの仮想マシン スケール セット全体で、1 つの MPI ジョブを、HBv2 仮想マシンの最大 36,000 コアで実行することができます。大規模なお客様の場合、HBv2 仮想マシンでは 1 つのジョブに対して最大 80,000 コアがサポートされます。

また、SRIOV ベースの高速ネットワークを Azure で使用することにより、HBv2 仮想マシンのイーサネット インターフェイスを最大化することも可能で、最大40 GB/秒の帯域幅、一貫した低待機時間が実現します。

最後に、この新しい H シリーズ仮想マシンの特徴をもう 1 つ紹介します。あらゆるファイル サイズと I/O パターンで超高速の一時記憶域を提供するローカル NVMe SSD です。新しい H シリーズ仮想マシンは、BeeGFS BeeOND などの最新のバースト バッファー テクノロジを使うことで、900 GB/秒を超えるピーク インジェクション I/O パフォーマンスを 1 つの仮想マシン スケール セット全体で発揮します。新しい H シリーズ仮想マシンでは、Azure Premium SSD ディスクもサポートされます。

お客様は、Azure HPC チームによって最適化および事前構成されたさまざまなリソースを使用して、HBv2 のデプロイを加速できます。Microsoft の事前構築済みの CentOS 向け HPCイメージは、パフォーマンスの最適化のために調整されています。また、さまざまな MPI ライブラリ、コンパイラなど、主要な HPC ツールがバンドルされています。AzureHPC プロジェクトは、お客様がエンドツーエンドの Azure HPC 環境を確実かつ迅速にデプロイするのを支援し、ネットワーク、コンピューティング、スケジューラ、ストレージの構成要素を設定するためのデプロイ スクリプトが含まれています。また、HPC アプリケーション自体を実行するためのチュートリアルのリストも含まれており、このチュートリアルの数は増え続けています。

HPC スケジューラに精通し、HBv2 仮想マシンでこれらを使用したいと考えているお客様については、Azure CycleCloud を使えば、最も簡単にクラスターの自動スケールを調整できます。Azure CycleCloud では、Slurm、PBSPro、LSF、GridEngine、HTCondor などのスケジューラがサポートされ、HBv2 仮想マシンと既存のオンプレミス クラスターのペアリングを望んでいるお客様向けに、ハイブリッド デプロイが可能です。新しい H シリーズ仮想マシンは、Azure Batch によるクラウドネイティブのバッチ処理でもサポートされます。HBv2 仮想マシンは、すべてのAzure プラットフォーム パートナーが利用できるようになります。

お客様はこのフォームに記入することにより、HBv2 アクセスに今すぐサインアップできます。HBv2 仮想マシンは、Azure の米国中南部および西ヨーロッパ リージョンで最初に利用可能になり、その他のリージョンについても、その後、順次利用可能になる予定です。