新しい HPC ターゲット クラウド仮想マシン
Azure HC シリーズの Virtual Machines は、米国西部 2 リージョンと米国東部リージョンで一般提供されるようになりました。HC シリーズの仮想マシン (VM) は、最も大規模で計算負荷の高い HPC アプリケーション用に最適化されています。このクラスのワークロードでは、HC シリーズ VM は、Azure またはパブリック クラウド上の他の場所で起動された中で最もパフォーマンスが高く、スケーラブルで、価格パフォーマンスが高くなります。
Intel® Xeon® Scalable プロセッサ、コードネーム Skylake を使用した HC シリーズは、AVX-512 命令、190 GB/秒のメモリ帯域幅、Intel® Parallel Studio XE HPC ソフトウェアの豊富なサポート、SR-IOV ベースの 100 Gb/秒 InfiniBand を使用して、最大 3.5 テラFLOPS (倍精度) を提供します。1 つの VM スケール セットの場合、1 つの分散メモリ ワークロードに最大 13,200 個の物理 CPU コアと 100 TB (テラバイト)を超えるメモリを利用できます。
HC は、密結合ワークロードのスーパーコンピューター クラスのスケールとパフォーマンスをパブリック クラウドに提供するという Azure のコミットメントを拡張し、すべての顧客が割り当て可能な価格ポイントで提供します。今日、Azure がクラウド HPC スケーラビリティの新しいマイルストーンを再び達成したと喜んで言えます。
最先端の HPC テクノロジ
HC シリーズ VM には、Intel® Xeon® Scalable 第 1 世代ファミリから最速の AVX、AVX2、AVX-512 クロック周波数を提供する Intel Xeon® Platinum 8168 プロセッサが搭載されています。これにより、AVX に最適化されたアプリケーションを利用する際に、より高いパフォーマンス向上を実現できます。
HC シリーズ VM では、44 個のハイパースレッディングされていない CPU コアと 352 GB の RAM が公開されており、ベースクロックは 2.7 GHz、オールコア ターボ速度は 3.4 GHz、シングルコア ターボ速度は 3.7 GHz です。HC VM には 700 GB のローカル NVMe SSD も搭載されており、新しい Azure P60/P70/P80 プレミアム ディスクを含む最大 4 つのマネージド ディスクがサポートされます。
HC シリーズ VM の主力機能は、Mellanox の 100 Gb/秒の InfiniBand です。HC シリーズ VM は、SR-IOV を介して Mellanox ConnectX-5 専用バックエンド NIC を公開します。つまり、お客様はベア メタル コンテキストで慣れているのと同じ OFED ドライバー スタックを使用できます。HC シリーズ VM は、ベアメタル InfiniBand デプロイに沿った整合性、帯域幅、およびメッセージ レートで、MPI 待機時間を最大 1.7 マイクロ秒で実現します。コンテキストの場合、これはパブリック クラウド上の他の場所よりも 8 倍から 16 倍低いネットワーク待ち時間です。
20,000 コアを超える分子動力学
Azure HPC チームは、お客様の多様なニーズを反映するために、広く使用されている多くの HPC アプリケーションのベンチマークを実施しました。アプリケーションの一般的なクラスの 1 つは、分子の物理的および化学的特性をシミュレートするクラスです。それ以外の場合は分子動力学と呼ばれます。HC シリーズの VM がスケーリングできる距離を確認するために、CP2K を使用してベンチマークしました。いくつかの理由から CP2K を選択しました。1 つは、学術と業界の両方で広く使用されています。実際、CP2K は、ヨーロッパに展開されているスーパーコンピューターの受け入れテストを推進するために、欧州統合アプリケーション ベンチマーク スイートの一部として PRACE によって使用される 13 のアプリケーションの 1 つです。もう 1 つは、CP2K は AVX-512 の利点があるため、最新のハードウェアとソフトウェアの機能が組み合わされたときに何が可能かを示す良いデモです。ここで公式の CP2K ドキュメントの手順に従って、テスト済みの CP2K をインストールして実行できます。
このスケーリング演習の結果を次に示します。
図 1: H20-DFT-LS ケース
ノード |
Ranks/Node |
スレッド/ランク |
ケース/日 |
解決までの時間 |
8 |
8 |
5 |
101 |
852.715 |
16 |
4 |
11 |
210 |
410.224 |
32 |
8 |
5 |
390 |
221.202 |
64 |
8 |
5 |
714 |
121.192 |
108 |
4 |
11 |
1028 |
84.723 |
128 |
8 |
5 |
1289 |
67.876 |
192 |
12 |
3 |
1515 |
57.827 |
256 |
4 |
11 |
3756 |
23.789 |
288 |
2 |
22 |
3927 |
22.009 |
392 |
2 |
22 |
4114 |
21.818 |
線形スケーリング DFT と 2048 水分子を使用した単一ポイントエネルギー計算である H20-DFT-LS ベンチマーク (図 1) では、HC シリーズ VM は 392 VM と 17,248 コアに正常にスケーリングされました。最も印象的なのは、最大レベルのスケールで、8 台の VM のベースラインと比較して、HC VM では、VM リソースの 49 倍の増加に比べて、1 日あたりのスループットが 40.7 倍向上しました。ここでは、288 台の VM が、大規模なスケーリングに最適な価格パフォーマンスのバランスを提供します。
図 2: LiHFX ケース
ノード |
Ranks/Node |
スレッド/ランク |
ケース/日 |
解決までの時間 |
24 |
6 |
7 |
55 |
1556.201 |
36 |
4 |
11 |
86 |
1002.111 |
44 |
11 |
4 |
219 |
394.847 |
64 |
8 |
5 |
294 |
293.091 |
108 |
4 |
11 |
482 |
179.469 |
112 |
7 |
6 |
482 |
179.344 |
128 |
8 |
5 |
530 |
163.095 |
176 |
11 |
4 |
685 |
126.899 |
256 |
4 |
11 |
960 |
90.14 |
324 |
4 |
11 |
1016 |
85.871 |
512 |
2 |
22 |
1440 |
60.176 |
LiHFX ベンチマークでは、432 電子を持つ 216 原子の水素リチウム結晶をシミュレートする単一点エネルギー計算である HC シリーズ VM は、512 個の VM と 22,528 コアに正常にスケーリングされました。繰り返しますが、コンピューティング投資の収益率は大きくなります。最上位の規模で、24 台の VM のベースラインと比較して、HC VM では、VM リソースが 21.3 倍増加するため、1 日あたりのスループットが 26.2 倍向上しました。
Azure での HPC のお客様の喜び
HC シリーズ VM の独自の機能とコスト パフォーマンスは、研究と生産性を新たな高みへと高めるために、ハイパフォーマンス コンピューティングに依存する科学者やエンジニアにとって大きな勝利です。航空宇宙、自動車、防衛、金融サービス、重機、製造、石油とガス、公的機関の学術、政府の調査にまたがる組織は、HC シリーズの VM を使用して HPC アプリケーションのパフォーマンスを向上させ、より迅速な分析情報を提供できるようになりました。
今すぐ利用可能
Azure Virtual Machine HC シリーズは現在、米国西部 2 と米国東部で利用でき、近日中に追加のリージョンがロールアウトされます。
• Azure のハイ パフォーマンス コンピューティング (HPC) の詳細を確認します。
• Azure Virtual Machines について 説明します。