メイン コンテンツにスキップ

 Subscribe

新しい HPC ターゲット クラウド仮想マシン

Azure HC シリーズの Virtual Machines は、米国西部 2 リージョンと米国東部リージョンで一般提供されるようになりました。HC シリーズの仮想マシン (VM) は、最も大規模で計算負荷の高い HPC アプリケーション用に最適化されています。このクラスのワークロードでは、HC シリーズ VM は、Azure またはパブリック クラウド上の他の場所で起動された中で最もパフォーマンスが高く、スケーラブルで、価格パフォーマンスが高くなります。

Intel® Xeon® Scalable プロセッサ、コードネーム Skylake を使用した HC シリーズは、AVX-512 命令、190 GB/秒のメモリ帯域幅、Intel® Parallel Studio XE HPC ソフトウェアの豊富なサポート、SR-IOV ベースの 100 Gb/秒 InfiniBand を使用して、最大 3.5 テラFLOPS (倍精度) を提供します。1 つの VM スケール セットの場合、1 つの分散メモリ ワークロードに最大 13,200 個の物理 CPU コアと 100 TB (テラバイト)を超えるメモリを利用できます。

HC は、密結合ワークロードのスーパーコンピューター クラスのスケールとパフォーマンスをパブリック クラウドに提供するという Azure のコミットメントを拡張し、すべての顧客が割り当て可能な価格ポイントで提供します。今日、Azure がクラウド HPC スケーラビリティの新しいマイルストーンを再び達成したと喜んで言えます。

最先端の HPC テクノロジ

HC シリーズ VM には、Intel® Xeon® Scalable 第 1 世代ファミリから最速の AVX、AVX2、AVX-512 クロック周波数を提供する Intel Xeon® Platinum 8168 プロセッサが搭載されています。これにより、AVX に最適化されたアプリケーションを利用する際に、より高いパフォーマンス向上を実現できます。

HC シリーズ VM では、44 個のハイパースレッディングされていない CPU コアと 352 GB の RAM が公開されており、ベースクロックは 2.7 GHz、オールコア ターボ速度は 3.4 GHz、シングルコア ターボ速度は 3.7 GHz です。HC VM には 700 GB のローカル NVMe SSD も搭載されており、新しい Azure P60/P70/P80 プレミアム ディスクを含む最大 4 つのマネージド ディスクがサポートされます。

HC シリーズ VM の主力機能は、Mellanox の 100 Gb/秒の InfiniBand です。HC シリーズ VM は、SR-IOV を介して Mellanox ConnectX-5 専用バックエンド NIC を公開します。つまり、お客様はベア メタル コンテキストで慣れているのと同じ OFED ドライバー スタックを使用できます。HC シリーズ VM は、ベアメタル InfiniBand デプロイに沿った整合性、帯域幅、およびメッセージ レートで、MPI 待機時間を最大 1.7 マイクロ秒で実現します。コンテキストの場合、これはパブリック クラウド上の他の場所よりも 8 倍から 16 倍低いネットワーク待ち時間です。

20,000 コアを超える分子動力学

Azure HPC チームは、お客様の多様なニーズを反映するために、広く使用されている多くの HPC アプリケーションのベンチマークを実施しました。アプリケーションの一般的なクラスの 1 つは、分子の物理的および化学的特性をシミュレートするクラスです。それ以外の場合は分子動力学と呼ばれます。HC シリーズの VM がスケーリングできる距離を確認するために、CP2K を使用してベンチマークしました。いくつかの理由から CP2K を選択しました。1 つは、学術と業界の両方で広く使用されています。実際、CP2K は、ヨーロッパに展開されているスーパーコンピューターの受け入れテストを推進するために、欧州統合アプリケーション ベンチマーク スイートの一部として PRACE によって使用される 13 のアプリケーションの 1 つです。もう 1 つは、CP2K は AVX-512 の利点があるため、最新のハードウェアとソフトウェアの機能が組み合わされたときに何が可能かを示す良いデモです。ここで公式の CP2K ドキュメントの手順に従って、テスト済みの CP2K をインストールして実行できます。

このスケーリング演習の結果を次に示します。

H20-DFT-LS test case results

図 1: H20-DFT-LS ケース

ノード

Ranks/Node

スレッド/ランク

ケース/日

解決までの時間

8

8

5

101

852.715

16

4

11

210

410.224

32

8

5

390

221.202

64

8

5

714

121.192

108

4

11

1028

84.723

128

8

5

1289

67.876

192

12

3

1515

57.827

256

4

11

3756

23.789

288

2

22

3927

22.009

392

2

22

4114

21.818

 

線形スケーリング DFT と 2048 水分子を使用した単一ポイントエネルギー計算である H20-DFT-LS ベンチマーク (図 1) では、HC シリーズ VM は 392 VM と 17,248 コアに正常にスケーリングされました。最も印象的なのは、最大レベルのスケールで、8 台の VM のベースラインと比較して、HC VM では、VM リソースの 49 倍の増加に比べて、1 日あたりのスループットが 40.7 倍向上しました。ここでは、288 台の VM が、大規模なスケーリングに最適な価格パフォーマンスのバランスを提供します。

LiHFX test case results

図 2: LiHFX ケース

ノード

Ranks/Node

スレッド/ランク

ケース/日

解決までの時間

24

6

7

55

1556.201

36

4

11

86

1002.111

44

11

4

219

394.847

64

8

5

294

293.091

108

4

11

482

179.469

112

7

6

482

179.344

128

8

5

530

163.095

176

11

4

685

126.899

256

4

11

960

90.14

324

4

11

1016

85.871

512

2

22

1440

60.176

 

LiHFX ベンチマークでは、432 電子を持つ 216 原子の水素リチウム結晶をシミュレートする単一点エネルギー計算である HC シリーズ VM は、512 個の VM と 22,528 コアに正常にスケーリングされました。繰り返しますが、コンピューティング投資の収益率は大きくなります。最上位の規模で、24 台の VM のベースラインと比較して、HC VM では、VM リソースが 21.3 倍増加するため、1 日あたりのスループットが 26.2 倍向上しました。

Azure での HPC のお客様の喜び

HC シリーズ VM の独自の機能とコスト パフォーマンスは、研究と生産性を新たな高みへと高めるために、ハイパフォーマンス コンピューティングに依存する科学者やエンジニアにとって大きな勝利です。航空宇宙、自動車、防衛、金融サービス、重機、製造、石油とガス、公的機関の学術、政府の調査にまたがる組織は、HC シリーズの VM を使用して HPC アプリケーションのパフォーマンスを向上させ、より迅速な分析情報を提供できるようになりました。

今すぐ利用可能

Azure Virtual Machine HC シリーズは現在、米国西部 2 と米国東部で利用でき、近日中に追加のリージョンがロールアウトされます。

• Azure
のハイ パフォーマンス コンピューティング (HPC) の詳細を確認します。

• Azure Virtual Machines について
説明します

  • Explore

     

    Let us know what you think of Azure and what you would like to see in the future.

     

    Provide feedback

  • Build your cloud computing and Azure skills with free courses by Microsoft Learn.

     

    Explore Azure learning


Join the conversation