ナビゲーションをスキップする

Azure での SQL Data Warehouse を使用した新しいパフォーマンス ベンチマークの設定

7月 12, 2018 に投稿済み

Chief Technology Officer, Azure Data

データ量の急激な増加に伴い、データをすばやく利用して組織全体で分析情報を共有しなければならないというプレッシャーも急速に高まっています。Microsoft は、自社の分析ポートフォリオを拡充しながら、クラウドで高速、柔軟、かつセキュアな分析プラットフォームを可能にするデータ ウェアハウス ソリューションを提供できるように全力で取り組んでいます。

本日は、Azure SQL Data Warehouse がクエリ パフォーマンスをこれまでの 2 倍以上高めることによって、クラウド データ ウェアハウジングの新しいパフォーマンス ベンチマークを設定したことを発表いたします。この技術革新の鍵は、高速データ移動、つまり、データ ウェアハウスの計算ノード間の極めて効率的な移動を可能にする機能です。すべての分散データベース システムの中心となるは、最終結果セットや中間結果セットを生成するために別々のキーでパーティション分割された複数のテーブルを揃えることです。SQL Data Warehouse の高速データ移動によって、この動作が加速され、クエリ パフォーマンスが向上しました。このブログでは、クエリ パフォーマンスがどのように向上するかについて詳細を確認できます。

Azure SQL Data Warehouse を使用して数分で分析情報を得る

データはすべての決定をより良いものにしますが、市場で優位に立つためにはタイムリーに決定を下す必要があります。迅速な決定のためには高速なデータ ウェアハウスが必要です。United Airlines は、組織全体で販売分析を広く利用可能にすることにより、競争の激しい市場で自社を差別化しています。しかし最近まで、分析情報が利用できるようになるまでに最大で 1 週間かかっていました。United Airlines は、信頼できるパートナーの Capax Global の支援を得て、Azure 上に、Azure SQL Data Warehouse の超高速クエリ パフォーマンスと大規模クエリ コンカレンシーを利用した最新のデータ ウェアハウス ソリューションを構築しました。

United Airlines の販売基盤担当重役である Dan Black 氏は次のように述べています。「弊社のオンプレミス データ プラットフォームを Azure SQL Data Warehouse に移行した結果、データの読み込み速度が 200 倍にもなり、社内チームのデータ アクセスを高速化させることができました。完全に管理されたデータ ウェアハウス ソリューションのおかげで、環境を管理するための負担の軽減およびコストの削減を実現でき、データの配信パフォーマンスが向上されました。月に 20,000 ドル以上の節約ができています。」

SQL Data Warehouse が新しい業界標準を設定

アダプティブ キャッシングなどの Compute Optimized Gen2 の進歩の上に構築された Azure SQL Data Warehouse は、2 つの主要な顧客基準 (クエリ パフォーマンスとクエリ コンカレンシー) のベンチマークを設定しました。

クエリ パフォーマンス

最近、Gigaom Research は、クラウド データ ウェアハウスのパフォーマンスを測定するために、業界標準として知られる TPC Benchmark™ H (TPC-H) からのワークロードを使用して、Azure SQL Data Warehouse と Amazon Redshift 間のベンチマーク テストを実施しました。

Gigaom の調査によれば、Azure SQL Data Warehouse は Amazon Redshift より 67% 以上速く 30 TB のワークロードを実行しました。

図 1

Gigaom は、実行時のパフォーマンスだけでなく、特定のワークロードに対するコスト (米国ドル) を定量化する価格性能比も測定しました。30 TB のワークロードでは、SQL Data Warehouse は Redshift より 23% 以上低コストでした。SQL Data Warehouse を使用すれば、処理性能を柔軟にスケーリングできるだけでなく、ワークロードの一時停止や再開も可能なので、お客様は従量課金でサービスを利用しながら、コストを最大限に削減することができます。

図 2

このパフォーマンス データは Gigaom Research から入手したものですが、このレポートを読むことにより、公平な比較を行うために実施されたその他の手順を確認できます。

クエリ コンカレンシー

Azure SQL Data Warehouse は、組織内でのデータの可用性を確保するうえでも役立ちます。サービスが強化され、128 件のクエリを同時実行できるようになったことで、他の要求によってブロックされることなく、同じデータベースに対してより多くのユーザーがクエリを実行できるようになりました。これに対し、Amazon Redshift ではクエリの同時実行数が最大 50 件であるため、組織内でのデータ アクセスが大きく制限されます。

Azure SQL Data Warehouse では、ストレージとコンピューティングを分離した独自のアーキテクチャにより、余分なコストをかけずに、このようなクエリ パフォーマンスとクエリ コンカレンシーの向上を実現しています。

Azure は分析に最適

Azure は、組織が、特定のニーズに合ったソリューションを使用して、データから分析情報を抽出し、革新を加速させるために最適です。お客様は、Power BI、Azure Databricks、Azure Data Factory、およびその他の Azure サービスとの緊密な統合を活用して、エンドツーエンドの分析ソリューションを効率的かつ経済的に構築することができます。