Azure Databricks – VNet インジェクション、DevOps バージョン コントロール、および Delta の利用可能性

3月 13, 2019 に投稿済み

Group Product Manager, Azure Data

Azure Databricks は、高速かつ簡単でコラボレーションに対応した Apache® Spark™ ベースの分析プラットフォームを提供することで、ビジネスを推進するビッグ データと AI のソリューションを構築するプロセスを高速で簡単なものにします。すべてが業界最高の SLA によって裏付けられています。

Azure Databricks を使用すると、Spark 環境を数分で設定してすばやく簡単に自動スケーリングできます。既存のスキルを応用し、Python、Scala、R、および SQL、さらには TensorFlow や PyTorch などのデータ サイエンス フレームワークとライブラリをサポートする対話型ワークスペースで共有プロジェクトの共同作業を行うこともできます。

マイクロソフトは、このサービスを発展させるために、継続的にお客様の声を聞き、質問に答えます。このブログでは、お客様に提供している重要なサービスの発表について概説します。

Standard SKU および Premium SKU で利用可能な Azure Databricks Delta

Azure Databricks Delta では、トランザクションのサポート、スキーマ検証、インデックス作成、データ バージョン管理などの多数の改善に基づいて、運用環境のワークロードの信頼性とパフォーマンスを新たなレベルに導きます。

Delta のプレビュー版が発表されて以来、バッチとストリーミング データの両方での複雑なパイプラインと、簡略化された ETL パイプラインの構築においてどれだけ役立ったかについて、極めて好意的なフィードバックをお客様からいただいています。この度、Premium SKU オファリングに加えて、Standard SKU オファリングにおける Delta の提供開始を発表します。これにより、その機能を最大限まで活用して、より効率的にパイプラインを構築できます。Databricks Delta の信頼性とパフォーマンスによるベネフィットを誰でも享受できるようになりました。

Azure Databricks Delta の詳細については、ガイド「Introduction to Databricks Delta (Databricks Delta 入門)」を参照し、クイック スタート ノートブック をインポートすることができます。

Azure DevOps Services バージョン コントロール

Azure DevOps は、DevOps の柱となるプラクティス、つまり計画と追跡、開発、ビルドとテスト、デリバリー、監視と運用にエンド ツー エンド ソリューションを提供するサービスのコレクションです。

マイクロソフトは、当初、GitHub と Azure Databricks Azure Databricks の統合から着手しました。多くのご要望により、Git プロバイダーを Azure DevOps Services に設定する機能を導入しました。

Azure DevOps Services による認証は、Azure Active Directory (Azure AD) を使用して認証する際に自動的に行われます。Azure DevOps Services の組織は、Databricks と同じ Azure AD テナントにリンクされている必要があります。ドキュメント「Azure DevOps Services Version Control (Azure DevOps Services バージョン コントロール)」で示されているように、自社の Git プロバイダー として Azure DevOps Services を簡単に選択できます。

自社の Azure 仮想ネットワーク内での Azure Databricks のデプロイ (VNet インジェクション) (プレビュー版)

既定で、マイクロソフトが、管理されている VNET 内でピアリングを有効にしてお客様に代わってクラスターをデプロイおよび管理します。マイクロソフトがこれらの VNET の作成と管理を行いますが、これらはお客様のサブスクリプション内のものです。付随するネットワーク セキュリティ グループの規則もマイクロソフトが管理します。

ただし、一部のお客様はネットワークをカスタマイズする必要があります。ご希望であれば、自社の既存の仮想ネットワークに Azure Databricksをデプロイ (VNet インジェクション) できるようになりました。Azure Databricks は、サービス エンドポイントを使用して安全な方法で Azure Storage などの他の Azure サービスに接続するか、オンプレミスの データ ソースに接続して Azure Databricks と共に使用して、ユーザー定義のルートを活用してください。Azure Databricks を ネットワーク仮想アプライアンスに接続して、すべての送信トラフィックを調査し、許可規則と拒否規則に従ってアクションを実行することもできます。Azure Databricks を構成してカスタム DNS を使用し、ネットワーク セキュリティ グループ (NSG) の規則を構成してエグレス トラフィック制約を指定します。

Azure Databricks を自社の仮想ネットワークにデプロイすると、柔軟な CIDR 範囲を活用することもできます。Azure Portal UI を使用して自社の Vnet 内で Azure Databricks を短時間で簡単に構成する方法については、このドキュメントをご覧ください。

今すぐお試しください

Azure Databricks をお試しいただき、フィードバックをお寄せください。