Azure Synapse Analytics でサンプルを使ってすぐに作業を開始する

2020年10月22日 に投稿済み

Director of Product, Azure Data

Azure Synapse Studio で新しいナレッジ センターを利用すると、最初のプロジェクトの作業をすぐに開始できます。

Microsoft Azure Synapse Analytics で分析情報を得るまでの時間をさらに短縮するために、あらかじめ読み込まれているサンプル データへのアクセスをシンプルにし、データ専門家の作業開始プロセスを合理化するナレッジ センターが導入されました。Spark や SQL プールの作成や既存のプールの使用、Azure Open Datasets への接続や照会、サンプル スクリプトやノートブックの読み込み、パイプライン テンプレートへのアクセス、Azure Synapse Studio のツアーが、すべて 1 か所から利用できるようになりました。

ナレッジ センターが表示された Azure Synapse Studio

ナレッジ センターへは、Azure Synapse Studio のホームページにある [役に立つリンク] から、またはナビゲーション バーの疑問符アイコンをクリックしてアクセスできます。

ナレッジ センターへのアクセスに使用できる [役に立つリンク] とメイン ナビゲーションのヘルプ バーの両方が表示された Azure Synapse ワークスペースのホームページ

サンプルをすぐに使用する

ナレッジ センターには、データを瞬時に調査して分析するために必要なすべてのものが作成される、ワンクリックのチュートリアルがいくつか用意されています。

利用できる以下の 3 つのチュートリアルが示されたナレッジ センター内の [Use samples immediately] (サンプルをすぐに使用する) カード: [Explore sample data with Spark] (Spark を使用してサンプル データを調べる)、[Query data with SQL] (SQL を使用してデータを照会する)、[Create external table with SQL] (SQL を使用して外部テーブルを作成する)

[Explore sample data with Spark] (Spark を使用してサンプル データを調べる) チュートリアルでは、Apache Spark プールを簡単に作成し、ノートブックを Azure Synapse 内でネイティブに使用して、ニューヨーク市 (NYC) のイエロー キャブのデータの分析と視覚化のカスタマイズができます。これが可能なのは、Azure Synapse によって SQL と Spark 両方での開発が同じ分析サービス内で統合されるからです。

Spark とノートブックを使用してデータの視覚化をカスタマイズする方法が示された [Explore sample data with Spark] (Spark を使用してサンプル データを調べる) チュートリアル

[Query data with SQL] (SQL を使用してデータを照会する) チュートリアルでは、サーバーレス SQL プールを使用して、同じ NYC のイエロー キャブのデータセットを照会および分析できます。これにより、専用リソースのプロビジョニングや管理をせずに、T-SQL を使用した高速なデータ レイクの探索が可能になります。このチュートリアルでは、1 回のクリックで結果をすばやく視覚化することもできます。

サーバーレス SQL プールを使用して結果を視覚化する方法が示された [Query data with SQL] (SQL を使用してデータを照会する) チュートリアル

[Create external table with SQL] (SQL を使用して外部テーブルを作成する) チュートリアルでは、サーバーレスまたは専用 SQL プールのどちらかを使用して外部テーブルを作成することができます。これにより、独自の条件に従ってデータを利用したり、各ユース ケースにおいて最もコスト効果の高いオプションを選択したりできる柔軟性がもたらされます。専用 SQL プールを使用すると、ワークロードの分離やワークロードの優先度といった一連の幅広いワークロード管理機能が提供されます。

結果をテーブル形式で視覚化する方法が示された [Create external table with SQL] (SQL を使用して外部テーブルを作成する) チュートリアル

使用可能なサンプルを参照する

新しいナレッジ センターには、すぐに作業を開始できるように、多数のサンプル データセット、ノートブック、スクリプト、パイプライン テンプレートも含まれています。

データセット、ノートブック、SQL スクリプト、パイプラインのサンプルにアクセスできるタブが示されたサンプル センター

Azure Open Datasets を追加すると、新型コロナ ウイルス、公共の安全、交通、経済指標などに関するサンプル データにアクセスできます。データセットは、メイン ナビゲーションの [データ] ハブにある [リンク済み] タブ[Azure Blob Storage] の下に自動的に読み込まれます。ボタンをクリックすると、サンプル スクリプトを実行して、上から 100 行を選択して外部テーブルを作成できますし、新しいノートブックを作成することもできます。

Azure Synapse Studio の [データ] ハブにある [リンク済み] タブの [Azure Blob Storage] の下に読み込まれたサンプル データセット

PySpark、Scala、または Spark.NET C# のどれを好んで使用するかにかかわらず、さまざまなサンプル ノートブックを試すことができます。これらは、Azure Synapse Studio の [開発] ハブにある [ノートブック] の下に表示されます。

Azure Synapse Studio の [開発] ハブにある [ノートブック] の下に表示されたサンプル ノートブック

サンプル ノートブックに加えて、SQL オンデマンドを使用した Azure Open Datasets の分析動的 SQL を使用した COPY ステートメントの生成CSV、JSON、または Parquet ファイルの照会といった SQL スクリプトのサンプルも用意されています。これらのスクリプトがワークスペースで発行されると、メイン ナビゲーションの [開発] ハブにある [SQL スクリプト] の下に表示されます。

Azure Synapse Studio の [開発] ハブにある [SQL スクリプト] の下に表示されたサンプルの SQL スクリプト

さらに、さまざまなソースからデータをコピーするためのテンプレートを含む、約 30 個の異なるテンプレートがパイプラインのために用意されています。

[パイプライン] タブで利用できるオプションが示されたサンプル センター

Azure Synapse Studio のツアー

ナレッジ センターには、主な機能について理解するのに役立つ Azure Synapse Studio の総合的なツアーが用意されているので、最初のプロジェクトの作業をすぐに始めることができます。

Azure Synapse Studio のデジタル セルフガイド ツアー

ナレッジ センターを今すぐ試す