Azure Databricks

高速で使いやすい、コラボレーション対応の Apache SparkTM ベースの分析サービス

Apache Spark によるビッグ データ分析と AI のためのベストなソリューション

Azure Databricks であらゆるデータから分析情報を引き出して AI ソリューションを構築し、Apache Spark™ 環境を数分のうちにセットアップして自動スケーリングし、インタラクティブなワークスペースで共有プロジェクトの共同作業を行います。Azure Databricks は、TensorFlow、PyTorch、scikit-learn を含むデータ サイエンス向けのフレームワークとライブラリに加え、Python、Scala、R、Java、SQL をサポートします。

Apache Spark™ は、Apache ソフトウェア財団の商標です。

高速で最適化された Apache Spark 環境

人気のツール、プログラミング言語、フレームワーク向けのサポートが組み込まれた、インタラクティブなワークスペース

Azure Machine Learning がネイティブ統合された、ビッグ データのための強力な機械学習

Azure Synapse Analytics と連動する、高パフォーマンスのモダンなデータ ウェアハウス

最適化された Apache Spark 環境によりすばやく開始する

Azure Databricks では最新バージョンの Apache Spark が提供されており、オープンソース ライブラリとのシームレスな統合が可能です。グローバルな規模と Azure の使用可能性を備えたフル マネージドの Apache Spark 環境で、クラスターを起動して迅速な構築が行えます。クラスターは、高い信頼性とパフォーマンスを確保するよう設定、構成、微調整され、監視の必要はありません。自動スケーリングと自動終了を活用して、総保有コスト (TCO) を抑えます。

Azure Databricks のドキュメントを読む

共有ワークスペースと一般的なプログラミング言語により、生産性を向上させる

データ エンジニア、データ サイエンティスト、ビジネス アナリストのいずれであろうと、ワークスペースとノートブックのインタラクティブなエクスペリエンスにより、共有プロジェクトにおいて効率的に共同作業できます。Python、Scala、R、SQL などお好みのプログラミング言語で構築できます。GitHub と Azure DevOps により、ノートブックのバージョン コントロールを容易に実現できます。

Azure Databricks ワークスペースの作成方法の詳細

ビッグ データによる機械学習を加速させる

統合された Azure Machine Learning を使用して、高度な自動機械学習機能にアクセスし、適切なアルゴリズムとハイパーパラメーターをすばやく特定できます。クラウドからエッジに至るまで、デプロイされた機械学習モデルの管理、監視、更新を簡略化します。Azure Machine Learning は、実験、機械学習パイプライン、モデルのための中央レジストリも提供します。

Azure Databricks と Azure Machine Learning についてのウェビナーを見る

ハイパフォーマンスのモダンなデータ ウェアハウスを入手する

クラウドのデータ ウェアハウスを最新化し、比類のないレベルのパフォーマンスとスケーラビリティを実現します。任意のスケールでデータを結合し、分析用ダッシュボードと運用レポートから分析情報を入手します。Azure Data Factory を使用してデータ移動を自動化し、Azure Data Lake Storage にデータを読み込みます。Azure Databricks を使用してデータを変換およびクリーンアップした後、Azure Synapse Analytics を使用して視覚化できるようにします。

Azure 上のモダンなデータ ウェアハウスの詳細

業界最先端のセキュリティとコンプライアンス

  • Azure Active Directory とのネイティブ統合を活用し、ロールベースのアクセス制御を実現します。
  • 構成可能な仮想ネットワークを使用して、コンプライアンスを犠牲にせずに安全なアーキテクチャを作成します。
  • Azure Databricks ノートブック、クラスター、ジョブ、データのための詳細に設定されたユーザー アクセス許可により、安心して利用できます。

Azure Databricks の価格

  • クラスターをすばやく起動し、使用ニーズに合わせて自動スケーリングしましょう。Azure Databricks のすべての価格オプションをご確認ください。

さまざまな業界の企業から寄せられる信頼

クラウドベースのディープ ラーニングを使用して、安全上の問題を特定する

Shell は Azure、AI、マシンによる視覚化を活用して、顧客と従業員の安全性を高めています。

事例を見る

Shell

パフォーマンスを向上し、コスト削減を促進する

データ サービスを提供する renewablesAI は、Azure と Apache Spark を利用して、安定して利益を生み出す太陽エネルギー市場の構築を支援しています。

事例を見る

Renewables AI

Azure でエンドツーエンドの分析ソリューションを実現する

物流プロバイダーの LINX Cargo Care Group は、Azure Databricks を活用して全社的なイノベーションを促進しています。

事例を見る

LINX Cargo Care Group

Azure Databricks の概要

Azure の無料アカウントにサインアップして、すぐにアクセスする。
ドキュメントを読み、Azure Databricks の使用方法を学ぶ。
クイックスタートを読み、クラスター、ノートブック、テーブルなどを作成する。

コミュニティと Azure のサポート

MSDN フォーラムや Stack Overflow で Microsoft のエンジニアや Azure コミュニティのエキスパートに質問したりサポートを要請したりするか、Azure サポートに問い合わせてください。

人気のあるラボとテンプレート

自分のペースで進められるラボや、Microsoft やコミュニティによって作成されたよく利用されている一般的な構成用のクイックスタート テンプレートを探してください。

Azure Databricks についてよく寄せられる質問

  • Azure Databricks の SLA は、99.95 % の可用性を保証します。
  • Databricks ユニット (DBU) は、1 時間あたりのプロセス能力の単位で、1 秒あたりの使用量で課金されます。
  • Data Engineering ワークロードは、クラスターを自動的に開始および終了させ、そこで稼働するジョブのことです。たとえば、Azure Databricks ジョブ スケジューラがワークロードをトリガーすると、Apache Spark クラスターがそのジョブのためだけに起動します。ジョブが完了すると、クラスターは自動で終了します。
    Data Analytics ワークロードは自動化されません。たとえば、Azure Databricks ノートブック内のコマンドは、手動で終了されるまで Apache Spark クラスター上で実行されます。複数のユーザーがクラスターを共有し、共同して分析できます。

準備が整ったら、Azure の無料アカウントを設定しましょう。