Azure Databricks

高速で使いやすい、コラボレーション対応の Apache SparkTM ベースの分析サービス

最適化された Apache Spark でのビッグ データ分析および AI

Azure Databricks であらゆるデータから分析情報を引き出して AI ソリューションを構築し、Apache Spark™ 環境を数分のうちにセットアップして自動スケーリングし、インタラクティブなワークスペースで共有プロジェクトの共同作業を行います。Azure Databricks は、TensorFlow、PyTorch、scikit-learn を含むデータ サイエンス向けのフレームワークとライブラリに加え、Python、Scala、R、Java、SQL をサポートします。

Apache Spark™ は、Apache ソフトウェア財団の商標です。

信頼性の高いデータ エンジニアリング

バッチおよびストリーミング ワークロードのための大規模データ処理

すべてのデータを分析

完全で最新のデータ分析を可能にする

共同データ サイエンス

大規模なデータセットのデータ サイエンスを簡素化し加速

オープンソースに根ざした

高速で最適化された Apache Spark 環境

最適化された Apache Spark 環境によりすばやく開始する

Azure Databricks では最新バージョンの Apache Spark が提供されており、オープンソース ライブラリとのシームレスな統合が可能です。グローバルな規模と Azure の使用可能性を備えたフル マネージドの Apache Spark 環境で、クラスターを起動して迅速な構築が行えます。クラスターは、高い信頼性とパフォーマンスを確保するよう設定、構成、微調整され、監視の必要はありません。自動スケーリングと自動終了を活用して、総保有コスト (TCO) を抑えます。

Azure Databricks のドキュメントを読む

共有ワークスペースと一般的なプログラミング言語により、生産性を向上させる

オープンで統一されたプラットフォーム上で効果的にコラボレーションを行うことができ、データ サイエンティスト、データ エンジニア、ビジネス アナリストを問わず、あらゆる種類の分析ワークロードを実行することができます。Python、Scala、R、SQL などお好みのプログラミング言語で構築できます。GitHub と Azure DevOps により、ノートブックのバージョン コントロールを容易に実現できます。

Azure Databricks ワークスペースの作成方法の詳細

ビッグ データによる機械学習を加速させる

統合された Azure Machine Learning を使用して、高度な自動機械学習機能にアクセスし、適切なアルゴリズムとハイパーパラメーターをすばやく特定できます。クラウドからエッジに至るまで、デプロイされた機械学習モデルの管理、監視、更新を簡略化します。Azure Machine Learning は、実験、機械学習パイプライン、モデルのための中央レジストリも提供します。

Azure Databricks と Azure Machine Learning についてのウェビナーを見る

ハイパフォーマンスのモダンなデータ ウェアハウスを入手する

あらゆる規模のデータを結合し、分析用ダッシュボードや運用レポートから分析情報を入手します。Azure Data Factory を使用してデータ移動を自動化してから Azure Data Lake Storage にデータを読み込み、Azure Databricks を使用してそれを変換およびクリーンアップし、Azure Synapse Analytics を使用して分析できるようにします。クラウドのデータ ウェアハウスを最新化し、比類のないレベルのパフォーマンスとスケーラビリティを実現します。

Azure クラウド スケール分析の詳細情報

主なサービスの機能

最適化された Spark エンジン

高度に最適化された Apache Spark™ を搭載した自動スケーリング インフラストラクチャでのシンプルなデータ処理により、最大 50 倍のパフォーマンス向上を実現します。

機械学習実行時

PyTorch、TensorFlow、scikit-learn などの最先端で人気のフレームワークを使用して、機械学習を強化するための事前設定済みの機械学習環境にワンクリックでアクセスできます。

MLflow

実験の追跡と共有、実行の再現、モデルの共同管理を中央リポジトリから行います。

言語の選択

サーバーレスでも、プロビジョニング済みコンピューティング リソースでも、Python、Scala、R、Spark SQL、.Net などのお好みの言語を使用できます。

共同ノートブック

好みの言語とツールを使用してデータにすばやくアクセスして確認し、新しい分析情報を見つけて共有し、モデルを構築できます。

Delta Lake

完全なデータライフサイクル向けに設計されたオープンソースのトランザクションストレージ層を使用して、既存のデータ レイクにデータの信頼性とスケーラビリティをもたらします。

Azure サービスとのネイティブ統合

Azure Data Factory、Azure Data Lake Storage、Azure Machine Learning、Power BI などの Azure サービスとの深い統合により、エンドツーエンドの分析および機械学習ソリューションを完成させます。

対話型ワークスペース

データ サイエンティスト、データ エンジニア、ビジネス アナリスト間のシームレスなコラボレーションを実現します。

エンタープライズ レベルのセキュリティ

効率的なネイティブ セキュリティにより、データが存在する場所でデータを保護し、数千ものユーザーとデータセットに対応する準拠した、プライベートで、分離された分析ワークスペースを作成できます。

実稼働可能

CI/CD と監視用のエコシステム統合により、信頼性の高いデータプラットフォームで、ミッションクリティカルなデータワークロードを実行、スケーリングします。

ソリューション アーキテクチャの例

ビッグ データ アーキテクチャにおけるリアルタイム分析

ライブのストリーミング データから簡単に分析情報を得られます。あらゆる IoT デバイスや、Web サイトのクリックストリーム ログから継続的にデータを取得して、ほぼリアルタイムで処理することが可能です。

高度な分析アーキテクチャ

クラス最高の機械学習ツールを使用して、お持ちのデータをアクションにつながる分析情報に変えましょう。このアーキテクチャを利用すれば、規模を問わずあらゆるデータを結合し、大規模なカスタムの機械学習モデルを構築、デプロイできます。

機械学習ライフサイクル管理

Azure Databricks、MLflow、Azure Machine Learning を使用してエンドツーエンドの機械学習ライフサイクルを加速および管理し、機械学習アプリケーションを構築、共有、デプロイ、管理します。

データのセキュリティとプライバシーに交渉の余地はありません

  • 業界をリードするさまざまなセキュリティとコンプライアンスの機能を使用して、データと分析のソリューションをセキュリティ保護、監視、管理できます。

  • シングル サインオンと Azure Active Directory の統合を使用すると、データの担当者は分析情報を発見することにより多くの時間を費やすことができます。

  • Azure は、他のクラウド プロバイダーを上回る認定を受けています。包括的なリストをご確認ください

Azure Databricks の製品とサービスについての詳細情報

Azure Databricks の価格

さまざまな業界の企業から寄せられる信頼

クラウドベースのディープ ラーニングを使用して、安全上の問題を特定する

Shell は Azure、AI、マシンによる視覚化を活用して、顧客と従業員の安全性を高めています。

Shell

パフォーマンスを向上し、コスト削減を促進する

データ サービスを提供する renewablesAI は、Azure と Apache Spark を利用して、安定して利益を生み出す太陽エネルギー市場の構築を支援しています。

Renewables AI

Azure でエンドツーエンドの分析ソリューションを実現する

物流プロバイダーの LINX Cargo Care Group は、Azure Databricks を活用して全社的なイノベーションを促進しています。

LINX Cargo Care Group

Azure Databricks の概要

Azure の無料アカウントにサインアップして、すぐにアクセスする。

ドキュメントを読み、Azure Databricks の使用方法を学ぶ。

クイックスタートを読み、クラスター、ノートブック、テーブルなどを作成する。

コミュニティと Azure のサポート

MSDN フォーラムや Stack Overflow で Microsoft のエンジニアや Azure コミュニティのエキスパートに質問してサポートを受けるか、Azure サポートに問い合わせてください。

人気のあるラボとテンプレート

自分のペースで進められるラボや、Microsoft やコミュニティによって作成されたよく利用されている一般的な構成用のクイックスタート テンプレートを探してください。

最新の Azure Databricks のニュースとリソースを入手する

Databricks の最新情報、ブログ、お知らせ

Azure Databricks についてよく寄せられる質問

  • Azure Databricks の SLA は、99.95 % の可用性を保証します。
  • Databricks ユニット (DBU) は、1 時間あたりのプロセス能力の単位で、1 秒あたりの使用量で課金されます。
  • Data Engineering ワークロードは、クラスターを自動的に開始および終了させ、そこで稼働するジョブのことです。たとえば、Azure Databricks ジョブ スケジューラがワークロードをトリガーすると、Apache Spark クラスターがそのジョブのためだけに起動します。ジョブが完了すると、クラスターは自動で終了します。
    Data Analytics ワークロードは自動化されません。たとえば、Azure Databricks ノートブック内のコマンドは、手動で終了されるまで Apache Spark クラスター上で実行されます。複数のユーザーがクラスターを共有し、共同して分析できます。

準備が整ったら、Azure の無料アカウントを設定しましょう。