Azure SQL Data Warehouse が Azure Synapse Analytics に変わりました

2019年11月7日 に投稿済み

Director of Product, Azure Data

11 月 4 日、Microsoft は Azure SQL Data Warehouse の次の進化版である Azure Synapse Analytics を発表しました。Azure Synapse は、エンタープライズ データ ウェアハウスとビッグ データ分析がまとめられた無制限の分析サービスです。サーバーレスのオンデマンド リソースまたはプロビジョニング済みのリソースを使用しながら、大規模に、各自の条件で自由にデータをクエリすることができます。Azure Synapse では、これら 2 つの分野を統合された 1 つのエクスペリエンスにまとめて、ビジネス インテリジェンスおよび機械学習での即時のニーズに対応するためにデータの取り込み、準備、管理、提供を行います。

Azure Synapse を利用すると、データ担当者は使い慣れた SQL 言語を使用して、リレーショナルおよび非リレーショナル両方のデータをクエリできます。これは、データ探索およびアドホック分析にはサーバーレスのオンデマンド クエリを使用し、最も要求の厳しいデータ ウェアハウスのニーズにはプロビジョニング済みのリソースを使用して実行できます。1 つのサービスですべてのワークロードに対応します。

実際、これは、すべての TPC-H クエリをペタバイト規模で実行する最初で唯一の分析システムです。現在 SQL Data Warehouse をご利用のお客様は、Azure Synapse を使用すると、現在の実稼働環境にある既存のデータ ウェアハウス ワークロードを実行しながら、プレビュー段階にある新しい機能の一般提供が開始されると、そのメリットを自動的に享受できます。サインアップして新機能をプレビューできます。新機能には、サーバーレスのオンデマンド クエリ、Azure Synapse studio、Apache Spark™ 統合などがあります。

  Azure Synapse Analytics が Power BI、Azure Machine Learning、およびお客様のエコシステムに接続される仕組みを示した図。

データ ウェアハウスの枠を超えて SQL を使用する

クラウド ネイティブの分散 SQL 処理エンジンは Azure Synapse の基盤です。これにより、最も要求の厳しい企業データ ウェアハウス ワークロードをサービスがサポートできるようになります。今週の Ignite では、Azure Synapse でのデータ ウェアハウジングを容易にし、組織が SQL をより広範な分析ユース ケースに使用できるようにする魅力的な機能をいくつかご紹介しました。

すべてのデータから優れた分析情報を素早く抽出する

Azure Synapse は Power BI および Azure Machine Learning と緊密に統合されており、統計情報を使用してコーディングするデータ サイエンティストから、Power BI を使用するビジネス ユーザーまで、すべてのユーザーに分析情報を容易に提供できます。また、あらゆる種類の分析を可能にするために、ネイティブおよび組み込みの予測サポートと、Azure Synapse によるストリーミング データ、Parquet ファイル、および PolyBase の処理方法における実行時レベルの改善を発表します。詳しく見ていきましょう。

  • ネイティブの PREDICT ステートメントを使用すると、データ ウェアハウス内で機械学習モデルをスコアリングできます。これにより、大規模で複雑なデータ移動を行う必要がなくなります。PREDICT 関数 (プレビューで使用可能) は、オープン モデル フレームワークを基盤とし、予測を生成するための入力としてユーザーのデータを受け取ります。Azure Machine Learning や Apache Spark™ などのフレームワークでトレーニングされた既存のモデルを内部フォーマット表現に変換できるため、ユーザーはゼロから開始する必要がなく、分析情報の取得までの時間が短縮されます。

モデルを作成してアップロードし、データ ウェアハウスで SQL 分析を使用してスコアリングする方法を示す図。

  • 直接ストリーミング取り込みのサポートが導入されました。また、ストリーミング データに対する分析クエリを実行できるようになりました。複数のストリーミング入力にわたる結合、1 つ以上のストリーミング入力内の集計、半構造化データの変換、複数の一時ウィンドウなどの機能は、すべてデータ ウェアハウス環境で直接サポートされます (プレビューで使用可能)。ストリーミング取り込みの場合、お客様は Event Hubs (Kafka 用の Event Hubs を含む) および IoT Hubs と統合できます。

  • また、データ レイクとデータ ウェアハウスの両方のデータを共有するための Azure Data Share 統合によって、組織の内外でのデータの安全かつ容易な共有を妨げる障壁を取り除きます。

  • 新しい ParquetDirect テクノロジを使用することで、データ レイクでの対話型クエリーを実現しています (プレビューで使用可能)。エンジンに直接組み込まれたネイティブ サポートにより、Parquet ファイルにアクセスするように設計されています。データ スキャン速度の向上、インテリジェントなデータ キャッシュ、列ストア バッチ処理により、 PolyBase の実行速度が 13 倍以上向上しました。

ParquetDirect によるパフォーマンスの向上を示すグラフ。

ワークロードの分離

データ ウェアハウスの民主化を行うお客様をサポートするために、インテリジェントなワークロード管理の新機能を発表します。新しいワークロードの分離機能を使用すると、異種ワークロードの実行を管理しながら、データ ウェアハウスのリソースを柔軟に制御できます。これにより、実行の予測可能性が向上し、定義済みの SLA を満たすための機能が強化されます。

データ ウェアハウスでのワークロードの分離を示す画像。

COPY ステートメント

ペタバイト規模のデータを分析するには、ペタバイト規模のデータを取り込む必要があります。データ インジェスト プロセスを合理化するために、シンプルで柔軟な COPY ステートメントを導入します。Azure Synapse では、たった 1 つのコマンドで、データをデータ ウェアハウスに迅速かつ安全な方法でシームレスに取り込むことができます。

この新しい COPY ステートメントでは、1 つの T-SQL ステートメントを使用して、データの読み込みや標準の CSV ファイルの解析などを実行できます。

COPY ステートメントのサンプルコード:

COPY INTO dbo.[FactOnlineSales] FROM ’https://contoso.blob.core.windows.net/Sales/’

比類のないセキュリティでデータを保護する

Azure は、市場で最も高度なセキュリティとプライバシー機能を備えています。これらの機能は、自動化された脅威検出や常時有効なデータ暗号化など、Azure Synapse のファブリック内に構築されています。また、詳細なアクセスの制御については、企業は列レベルのセキュリティ、ネイティブの行レベルのセキュリティ、および動的データ マスク (一般提供されています) を使用して、機密データをリアルタイムで自動的に保護することにより、データを安全かつプライベートに保つことができます。

セキュリティとプライバシーをさらに強化するため、Azure Private Link を導入します。これにより、独自の Azure Virtual Network (VNet) からデプロイされたリソースを使用するための安全でスケーラブルな方法が提供されます。安全な接続は、同意ベースの呼び出しフローを使用して確立されます。いったん確立されると、Azure Synapse とサービス コンシューマーの間を流れるすべてのデータはインターネットから分離され、Microsoft ネットワーク上に保持されます。このサービスとの通信に、ゲートウェイ、ネットワーク アドレス変換 (NAT) デバイス、パブリック IP アドレスは不要になりました。

Azure Private Link (独自の Azure Virtual Network (VNet) からデプロイされたリソースを使用するための安全かつスケーラブルな方法) を示す画像。

今すぐご利用ください

企業では、Azure Synapse 上で一般提供されている機能を利用して、現在の実稼働環境内で既存のデータ ウェアハウスのワークロードを引き続き実行できます。


Azure。目的を持って創造する。