Azure Databricks – 手頃な価格の新機能

2019年3月6日 に投稿済み

Group Product Manager, Azure Data

Azure Databricks は、高速かつ簡単でコラボレーションに対応した Apache Spark™ ベースの分析プラットフォームを提供します。こうして、業界最高の SLA で裏打ちされたビッグ データと AI のソリューションを構築するプロセスが高速で簡単なものになります。

Azure Databricks を使用すると、お客様は最適化された Apache Spark 環境を数分でセットアップできます。データ サイエンティストとデータ エンジニアは、好みの言語とツールで対話型ワークスペースを使用して共同作業ができます。Azure Active Directory (Azure AD) などの Azure サービスとのネイティブ統合により、お客様は、エンドツーエンドの最新データ ウェアハウス、機械学習ソリューション、リアルタイムの分析ソリューションを構築できます。

既に大変多くのお客様に Azure Databricks をご採用いただいていますが、本日、市場に投入される新機能を発表いたします。

Data Engineering Light の一般提供

Data Engineering Light と呼ばれる低価格の新しいワークロードでお客様に Azure Databricks の利用を開始いただけるようになりました。これは、マネージド型の Apache Spark 上でバッチ アプリケーションを実行できる機能です。この機能が対象としているのは、Data Engineering や Data Analytics のワークロードによって提供されるようなパフォーマンスや自動スケーリングなどの利点を必要としない、単純で重要度の低いワークロードです。この新しいワークロードの作業を開始してみましょう。

さらに、Standard SKU と Premium SKU の両方で Data Engineering ワークロードの価格が引き下げられました。どちらの SKU も、利用コストが最大 25 パーセント引き下げられました。Azure Databricks SKU の新しい価格については、価格ページをご覧ください。

マネージド MLflow のプレビュー

MLflow は、機械学習ライフサイクルの管理に使用されるオープン ソース フレームワークです。マネージド MLflow を使用すると、お客様は Azure Databricks 環境からネイティブにアクセスでき、認証に Azure Active Directory を使用できます。Azure Databricks でマネージド MLflow を使用して、お客様が実現できる機能:

  • パラメーター、結果、コード、データを、すぐに利用可能なホスト型 MLflow トラッキング サーバーに自動的に記録することにより、実験を追跡する。実行を Azure Databricks 内から実験別に整理できるようになり、Azure Databricks ノートブック内から結果のクエリを実行して、パフォーマンスが最も優れたモデルを特定できます。
  • 再現可能なプロジェクト形式で機械学習コードと依存関係をローカルにパッケージ化し、Databricks クラスター上でリモートに実行する。
  • モデルを運用環境にすばやくデプロイする。

マネージド MLFlow の詳細はこちらを参照してください。

Azure Machine Learning と Azure Databricks を使用した Azure での機械学習

2018 年 12 月に Azure Machine Learning service (AML) の一般提供が開始され、Azure Databricks との統合がなされて以来、この組み合わせを利用してビッグ データの機械学習を加速化しているお客様から数多くの好意的なフィードバックをいただいてきました。Azure Machine Learning は、次のようにして Azure Databricks によるエクスペリエンスを補完します。

  • 自動機械学習の高度な機能を利用できるようにして、あらゆるスキル レベルのデータ サイエンティストが適切なアルゴリズムとハイパーパラメーターをより迅速に特定できるようにする。
  • 簡易管理、監視、機械学習モデルの更新に必要な機械学習用の DevOps を有効にする。
  • クラウドとエッジからモデルをデプロイする。
  • 組織全体にわたって作成される実験、機械学習パイプライン、モデルの中央レジストリを提供する。

Azure Databricks と Azure Machine Learning を組み合わせることで、Azure は機械学習に最適なクラウドになります。お客様は、自動スケーリングする最適化された Apache Spark ベースの環境、共同作業用ワークスペース、自動化された機械学習、エンド ツー エンドの機械学習ライフサイクル管理を活用できます。

Azure 上の機械学習のワークフロー

今すぐお試しください

Azure Databricks をお試しいただき、フィードバックをお寄せください。