ナビゲーションをスキップする

Azure Databricks

高速で使いやすい、コラボレーション対応の Apache Spark ベースの分析サービス

14 日間の試用版 - Databricks の単位を無料でご利用いただけます

概要

ビッグ データ分析と人工知能 (AI) のソリューションは、高速で使いやすい、コラボレーション対応の Apache Spark ベースの分析サービスである Azure Databricks を使用して加速化できます。

Spark 環境を数分で設定すると、すばやく簡単に自動スケーリングします。データ サイエンティスト、データ エンジニア、ビジネス アナリストは、対話型ワークスペースで共有プロジェクトの共同作業を行うことができます。Python、Scala、R、SQL をサポートする既存のスキルのほか、TensorFlow、Pytorch、Scikit-learn などのディープ ラーニングのフレームワークやライブラリを活用できます。Azure Active Directory (Azure AD) などの Azure サービスとのネイティブ統合により、最新のデータ ウェアハウスや機械学習ソリューション、リアルタイムの分析ソリューションの構築が可能になります。

Azure Databricks を選ぶ理由

生産性の高さ

新しい Apache Spark 環境をすぐに立ち上げます。対話型ワークスペースで他の Azure サービスとシームレスに統合されます。

拡張性

分析や機械学習プロジェクトをグローバルにスケーリングします。自動スケーリング (スケールアップとスケールダウン) を行う管理されたプラットフォームでは、コストが削減され、複雑さが軽減されます。

信頼性の高さ

Azure AD との統合、ロールベースの制御、エンタープライズ レベルの SLA でお客様のデータとビジネスを保護できます。

柔軟

言語やディープ ラーニング フレームワークを自由に選んで機械学習と AI のソリューションを構築します。

Azure Databricks の機能

最適化された Apache Spark 環境

クラスターを起動し、管理対象の Apache Spark 環境をすばやく組み込みます。クラスターは、高い信頼性とパフォーマンスを確保するよう設定、構成、微調整されます。

自動スケーリングと自動終了

ニーズに応じた自動スケーリング (スケールアップとスケールダウン) により、クラスターの手動スケールに伴うリソースとコストが削減されます。非アクティブなクラスターを自動終了すると、リソースが節約されます。

共同ワークスペース

対話型ワークスペースにより、データ エンジニア、データ サイエンティスト、ビジネス ユーザーがチームとして共有プロジェクトでの共同作業やコメントを行うことができます。

ディープ ラーニング用に最適化

GPU 対応クラスターを使用すると、AI モデルを大規模かつ簡単に構築、トレーニング、デプロイすることができます。TensorFlow、Keras、XGBoost などのディープ ラーニングのフレームワークやライブラリと共にプレインストールされて構成されている、機械学習用のランタイムを使用します。

Azure サービスとの統合

Azure SQL Data Warehouse、Azure Cosmos DB、Azure Data Lake Storage、Azure Event Hubs、Azure Data Factory などのさまざまなデータ ストアやサービスと簡単に統合できます。Azure AD を使用したシングル サインオンにより、ロールベースの制御を解除できます。

複数の言語とライブラリのサポート

Azure Databricks では、Python、Scala、R、SQL などの言語がサポートされているため、既存のスキルを活用して構築を開始できます。SQL、ストリーミング、MLlib、GraphX などの広範にわたる分析テクノロジを使用して、あらゆるデータ量やプロジェクト サイズを対象とします。

Azure Databricks を使用した分析と機械学習

手順 1/6

ワークスペースの起動

Azure portal で Azure Databricks に移動します。その後、Azure AD によるシングル サインオンを使ってログインします。

手順 2/6

クラスターの起動

新しいクラスターを作成して自在に構成し、1 回クリックするだけで実行できます。自動スケーリング機能により、クラスターのスケーリングは迅速かつ簡単に行われます。また、手動のスケーリングに伴うリソースとコストを減らす効果もあります。

手順 3/6

ノートブックを使ったコラボレーション

共同作成者それぞれが個々のアクセス レベルに基づいてライブでコラボレーションし、共有プロジェクトにコメントできるように、データ エンジニア、データ サイエンティスト、ビジネス ユーザーのカスタム アクセス許可の設定を作成します。

手順 4/6

データの調査

ノートブックでは、SQL、Python、Scala、R など、ほとんどのデータ言語がサポートされています。データ エンジニアとデータ サイエンティストは、簡単にストレージをマウントし、その結果を使用して機械学習モデルを構築できます。ビジネス ユーザーは、表示されたわかりやすいライブ データでデータを確認できます。

手順 5/6

データ サイエンス モデルの構築

お好みの言語を使用して AI モデルを大規模に構築、トレーニング、デプロイします。

手順 6/6

ジョブのスケジュール設定

わずか数分でノートブックをジョブとして実行できます。既存のストリーミング ライブラリまたは機械学習ライブラリから選択します。ジョブを自動的に実行するように前もってスケジュールを設定し、そのパフォーマンスを監視します。

Azure Databricks でできること

最新のデータ ウェアハウス

最新のデータ ウェアハウスでは、規模を問わずあらゆるデータを簡単に集約し、分析ダッシュボード、運用レポート、全ユーザーを対象とした高度な分析を通じて分析情報を入手できます。

ビッグ データの高度な分析

クラス最高の機械学習ツールを使用して、お持ちのデータをアクションにつながる分析情報に変えましょう。このアーキテクチャを利用すれば、規模を問わずあらゆるデータを結合し、カスタムの機械学習モデルを構築、デプロイできます。

リアルタイム分析

ストリーミング データから簡単に分析情報を得られます。あらゆるストリーミング ソースや、Web サイトのクリックストリーム ログから継続的にデータを取得して、ほぼリアルタイムで処理することが可能です。

関連製品およびサービス

SQL Data Warehouse

エンタープライズ クラスの機能を伴うエラスティックなサービスとしてのデータ ウェアハウス (data warehouse-as-a-service)

Machine Learning Studio

予測分析ソリューションを簡単に構築、デプロイ、管理

Azure Cosmos DB

あらゆるスケールに対応するグローバル分散型のマルチモデル データベース

Azure Databricks でデータドリブン イノベーションを促進