Azure Machine Learning Notebook VM の 3 つの特長

2019年6月10日 に投稿済み

Principal Program Manager, Azure Machine Learning

データ サイエンティストの職務は絶えず変化します。そのため、高速かつ柔軟な環境が必要になる一方で、組織のセキュリティ ポリシーやコンプライアンス ポリシーに従う必要もあります。

Azure Machine Learning Notebook VM の 3 つの特長

機械学習プロジェクトに携わるデータ サイエンティストは、実験の実行、モデルのトレーニング、反復学習、イノベーションを行うための柔軟な環境を必要としています。モデルの構築、トレーニング、デプロイメントに専念するためには、仮想マシン (VM) を準備したり、多数のパラメーターを入力したり、環境を変更するために何度も IT 担当者に依頼したりといったことに手間取るわけにはいきません。さらに、組織が定めるコンプライアンス ポリシーやセキュリティ ポリシーを遵守する必要もあります。

組織は、職場環境のセキュリティを維持しながらデータ サイエンティストが効率的に作業できるように支援する方法を模索しています。企業の IT 担当者は、セキュリティをロックダウンし、認証システムを一元化したいと考えています。一方、データ サイエンティストが重視しているのは、VM に直接アクセスして、低階層の CUDA ドライバーや特殊な最新の機械学習フレームワークを自由に操作することです。しかし、VM に直接アクセスするとなると、IT 担当者がセキュリティ ポリシーを適用することが難しくなります。Azure Machine Learning サービスでは、こういった課題を解決するために革新的な機能を開発しています。それらの機能を使用することで、データ サイエンティストはデータを最大限に活用し、ビジネス目標の達成にじっくり専念できると同時に、組織のセキュリティおよびコンプライアンス体制も維持できます。

2019 年 5 月に発表された Azure Machine Learning サービスの Notebook Virtual Machine (VM) は、そうした相反する要件を満たすと同時に、データ サイエンティストのエクスペリエンス全体を簡素化します。Notebook VM は、データ サイエンティストのために作られたクラウドベースのワークステーションです。Notebook VM ベースの作成機能は、Azure Machine Learning サービスに直接統合されており、Python 開発者がモデルをワークスペース内で簡単的に構築、デプロイできるコード ファーストのエクスペリエンスを提供します。開発者やデータ サイエンティストは、安全なエンタープライズ対応環境の中で、使い慣れた Jupyter Notebook を使用して、Azure Machine Learning Python SDK (英語) でサポートされているすべての操作を実行できます。Notebook VM は安全で使いやすく、機械学習用に事前構成されており、自由にカスタマイズ可能です。

それでは、Azure Machine Learning サービスの Notebook VM の特長を詳しく見ていきましょう。

  1. 安全で使いやすい
  2. 機械学習用に事前構成されている
  3. 自由にカスタマイズ可能

1.安全で使いやすい

データ サイエンティストが標準的な IaaS (サービスとしてのインフラストラクチャ) VM でノートブックを作成する場合、IT 固有の多数の複雑なパラメーターを設定する必要があります。VM の名前を入力し、イメージのタイトル、セキュリティ パラメーター (仮想ネットワーク、サブネットなど)、ストレージ アカウント、その他さまざまな IT 固有のパラメーターを指定する必要があります。指定したパラメーターが間違っていたり、詳細を見落としたりすれば、組織が深刻なセキュリティ リスクにさらされることになりかねません。

IaaS VM と比較すると、Notebook VM の作成エクスペリエンスは合理化されており、2 つのパラメーター (VM の名前と種類) を指定するだけで済みます。Notebook VM を作成すると、人気の高い 2 つのデータ サイエンス用ノートブック環境である Jupyter と JupyterLab にアクセスできるようになります。ノートブックへのアクセスは、HTTPS と Azure Active Directory によって標準でセキュリティが確保されているため、IT 担当者は多要素認証などの強力なセキュリティ機能を使用してシングル サインオン環境を強制適用し、組織のポリシーに遵守した安全な環境を確保することができます。

Azure Machine Learning Notebook VM – //Build 2019 のデモ

2.機械学習用に事前構成されている

従来の IaaS VM に GPU ドライバーを設定してライブラリをデプロイするには、手間と膨大な時間がかかります。また、特定のハードウェア、ライブラリ、フレームワークに適したドライバーを見つけるのも面倒です。たとえば、データ サイエンティストが使用しているドライバーでは、最新バージョンの PyTorch が動作しない可能性もあります。Azure Machine Learning Python SDK などのサービスのクライアント ライブラリをインストールするにも時間がかかるほか、一部の Python パッケージはインストール環境によっては他のパッケージとの互換性がない場合もあります。

Notebook VM では、最新の互換性のあるパッケージがあらかじめ構成されており、すぐに使い始められます。そのため、データ サイエンティストはバージョンの問題を気にすることなく、Notebook VM 上で任意の最新フレームワークを使用し、Azure Machine Learning サービスのあらゆる最新機能にアクセスできます。この VM には、Jupyter と JupyterLab に加えて、機械学習用の環境が準備されています。Notebook VM は、Azure が提供する人気の IaaS VM である Data Science Virtual Machine (DSVM) の系統を引き継いでおり、DSVM と同様に、事前構成された GPU ドライバーを搭載し、厳選された機会学習およびディープ ラーニング フレームワークがインストールされています。

Notebook VM は、上位の Azure Machine Learning ワークスペースとも統合されています。データ サイエンティストが VM 上で実行するノートブックからは、ワークスペースのデータ ストアとコンピューティング リソースにアクセスできます。ノートブック自体もワークスペースの Blob ストレージ アカウントに保存されるため、VM 間で簡単にノートブックを共有できるほか、VM が削除されても安全に保存できます。

3.自由にカスタマイズ可能

IT 担当者がデータ サイエンティストのために VM を準備する環境では、準備に多大な手間がかかるうえ、VM で実行できることが限られます。一方で、データ サイエンティストは絶えず変化するニーズに合わせて VM をカスタマイズする必要があります。そのため、多くの場合、VM に必要な変更を加えるために IT 担当者に何度も依頼することになります。それでも反復学習の結果がニーズに合わなかったり、時間がかかりすぎたりすると、作業が立ち行かなくなります。中には会社が用意した VM ではサポートされていないジョブを実行するために、最後の手段として個人用ノート PC を使用し、コンプライアンス ポリシーに違反して組織をリスクにさらすデータ サイエンティストもいます。

Notebook VM はマネージド VM ですが、ハードウェア機能へのフル アクセスが可能です。データ サイエンティストは、Azure でサポートされている任意の種類の VM を作成し、カスタムのパッケージやドライバーを追加して、自由にカスタマイズすることができます。たとえば、最新の NVIDIA Tesla V100 を搭載した VM をすばやく作成して、新しいニューラル ネットワーク アーキテクチャのデバッグのステップ実行を行うことができます。

利用を開始する

コードの作業に慣れていれば、Notebook VM をスムーズにご利用いただけます。Notebook VM に含まれているチュートリアルやサンプルを使用すると、Azure Machine Learning サービスのあらゆる機能にワンクリックでアクセスできます。ぜひお試しになり、フィードバック (英語) をお寄せください。

Azure Machine Learning サービスの詳細については、こちらのページをご確認ください。まずは、無料トライアルをお試しください。