Azure Machine Learning—すべてのスキル レベル向けの ML

2019年11月5日 に投稿済み

Group Program Manager, Microsoft Azure

今日の企業では、競合他社を一歩リードし、革新をもたらし、顧客体験を改善し、収益を拡大するため、人工知能 (AI) の採用が急速に進んでいます。AI と機械学習のアプリケーションは、各業界で、スキルセットから規模、効率、運用、ガバナンスへの変換の新時代の先駆けとなっています。

Microsoft Azure Machine Learning には、機械学習のライフサイクルを促進し、あらゆるスキル レベルの開発者やデータ サイエンティストが責任を持って大規模にモデルを構築、トレーニング、デプロイ、管理できるように支援するためのエンタープライズ レベルの機能が備わっています。Microsoft Ignite では、次の分野における Azure Machine Learning の数々の大きな進歩を発表する予定です。

  • あらゆるスキル レベルの開発者とデータ サイエンティストが機械学習の生産性を向上できるようにする、新しいスタジオ Web エクスペリエンス。コードが不要なドラッグアンドドロップ方式と、自動機械学習から、コードファーストの開発まで、柔軟な作成オプションを備えています。
  • 機械学習のライフサイクルを管理するための業界随一の新しい機械学習運用 (MLOps) 機能。これによりデータ サイエンス チームや IT チームはイノベーションをより迅速に実現できるようになります。
  • オープンで相互運用可能な新機能。R、Azure Synapse Analytics、Azure Open Datasets、ONNX などの一般的なフレームワーク、言語、ツールがサポートされており、柔軟に選択できます。
  • セキュリティとガバナンスの新機能。ロールベースのアクセス制御 (RBAC)、Azure 仮想ネットワーク (VNet)、容量管理、責任ある AI 解釈可能性と公平性のための最新機能を備えています。

これらの発表を詳しく調べて、個人、チーム、組織がビジネス目標を達成し、それを超えるのに、Azure Machine Learning がどのように役立っているかを見ていきましょう。

すべてのスキル レベルの機械学習にアクセスして生産性を向上する

「Azure Machine Learning の自動 ML を使用して予測を改善すれば、無駄を減らしつつ、お客様に確実にピザをご用意できます。これにより、オペレーターの当て推量を減らし、店舗運営の他の側面にフォーカスする時間を増やすことができます。店舗オペレーターは、用意するピザの数を推測することではなく、すべての顧客体験を最良のものにすることに注力しています。」- Little Caesars Pizza 社の CEO、Anita Klopfenstein 氏。

新しいスタジオ Web エクスペリエンス (現在プレビュー段階) を使用すると、すべてのスキル レベルのデータ サイエンティストやデータ エンジニアは、データ準備、モデルのトレーニング、デプロイ、管理などのエンドツーエンドの機械学習タスクを、シームレスに完了することができます。スキルとご希望に基づき、3 つの異なる作成オプションから選択できます。コードが不要なドラッグアンドドロップ方式のデザイナー、自動機械学習、またはコードファーストのノートブック エクスペリエンスです。Azure Machine Learning の資産 (データセットとモデルを含む) や、豊富な機能 (データ ドリフト、監視、ラベル付けなど) すべてに、1 か所からアクセスできます。

 

新しいスタジオ Web エクスペリエンスでは、1 つのペインからすべての機械学習ライフサイクル タスクにアクセスできます。

スタジオ Web エクスペリエンス

デザイナー (現在プレビュー段階) は、視覚エクスペリエンスを使用して機械学習モデルの構築、テスト、デプロイのプロセスを簡素化できる、ドラッグアンドドロップ ワークフローを備えています。現在、Azure Machine Learning Studio のクラシック バージョンを使用しているお客様は、Azure Machine Learning のスケールとセキュリティを活用できるように、デザイナーをお試しいただくことをお勧めします。

自動機械学習ユーザー インターフェイス (現在プレビュー段階) を使用すると、データ サイエンティストはコードを 1 行も書かずにモデルを構築することができます。特徴量エンジニアリング、アルゴリズムの選択、ハイパーパラメーターのスイープなどの時間がかかるタスクを自動化し、ボタンを数回クリックするだけでモデルを操作可能にします。

Notebooks (現在プレビュー段階) は、開発者とデータ サイエンティストが機械学習を簡単に開始できるようにするためのフル マネージド ソリューションであり、構成済みのカスタム環境によってセットアップ時間が省けます。一方、IT 管理者向けに、管理とエンタープライズ対応機能を備えています。

新しいデータのラベル付け (現在プレビュー段階)。教師あり学習の高精度モデルを作成するためには、高品質のラベル付きデータが必要不可欠です。チームは、スタジオ Web エクスペリエンス内からデータのラベル付けプロジェクトをシームレスに管理して、データに対するラベルを取得し、時間のかかる手動ラベル付けプロセスを高速化できるようになりました。サポートされているラベル付けタスクには、オブジェクト検出、複数クラスの画像の分類、複数ラベルの画像の分類などがあります。

業界随一の MLOps で大規模に運用できるようにする

Azure Machine Learning にはエンタープライズ レベルの機械学習ライフサイクル管理のための組み込みの MLOps 機能が備わっており、データ サイエンスと IT チームは協力してモデルの開発とデプロイのペースを向上させることができるようになります。

「TransLink は、Azure Machine Learning の MLOps を活用してモデルを構築および管理し、運用環境にデプロイすることができました。これにより、16,000 個を超える機械学習モデルをパイロットから運用環境に移行する際の効率と透明性が向上しました。最終的に、バスの予測出発時刻と実際の出発時刻の差異が 74% 改善されたため、TransLink のお客様は、TransLink のバス ネットワークでの移動の計画がさらに立てやすくなりました。」-TransLink 社の分析開発担当ディレクター、Sze-Wan Ng 氏。

再現可能なモデルを構築し、機械学習のガバナンスとコントロールを実現するための新しい更新

データセットは、データ サイエンティストと機械学習エンジニアが多数の Azure ストレージ サービスから簡単にデータにアクセスし、データセットを迅速に適用し、それらをさまざまなタスクで効率的に再利用し、データ系列を自動的に追跡するのに役立ちます。豊富なデータセットとモデルのレジストリは、資産と情報を追跡してモデルを効率的に運用化し、トレーニングから推論までのワークフローを簡素化するのに役立ちます。バージョン管理では、資産の追跡と管理を支援して、トレーサビリティを向上し、一貫性のあるモデル配信のための再現可能なパイプラインの作成をサポートします。監査証跡機能により、資産の整合性が確保され、規制要件を満たすのに役立つ制御ログが提供されます。

モデルを簡単にデプロイし、機械学習のライフサイクルを効率的に管理するための新しい更新

バッチ推論は、テラバイト単位の構造化または非構造化データの予測を生成して、生産性を向上させ、コストを削減するのに役立ちます。制御されたロールアウトにより、さまざまなモデルのバージョンを共通のスコアリング エンドポイントの下でデプロイし、高度なデプロイ パイプラインの実装と、モデルのリリースを自信を持って行えるようになります。データ ドリフトの監視は、経時的なモデル入力データの変更からモデル パフォーマンスの問題を検出することで、モデルの正確性を維持するのに役立ちます。ドリフト分析には、ドリフトの大きさ、特徴量ごとの影響、その他の分析情報が含まれているため、モデルの再トレーニングなどの適切なアクションを取ることができます。

 

データ ドリフトの視覚化などの MLOps の機能により、ここで経時的に増加するドリフトの大きさや、ドリフトに対する特徴量の影響などのメトリックがスタジオ Web エクスペリエンスで提供されます。

データ ドリフトの監視

オープンで相互運用可能な機能を活用した革新

Azure Machine Learning を使用することで、開発者やデータ サイエンティストは、PyTorch、TensorFlow、scikit-learn などのオープンソース ツールやフレームワーク、またはオープンで相互運用可能な ONNX 形式の組み込みサポートを利用できます。Microsoft では、機械学習を表現するオープン標準である Open Neural Network Exchange (ONNX) がサポートされるようになりました。新しい v1.0 リリースでは、ONNX ランタイムは CPU と GPU のどちらでも Azure Machine Learning で使用できる安定した Python API が提供されます。

新しい R ベースの機能により、データ サイエンティストは Azure Machine Learning で R ジョブを実行し、R モデルを Web サービスとして管理およびデプロイできるようになります。データ サイエンティストは最適の開発環境を選ぶことができます。RStudio Server (オープンソース エディション) か Jupyter with R のブラウザー統合開発 (IDE) にワンクリックでアクセスできます。

Azure Synapse Analytics が Azure Machine Learning と密接に連携するようになり、お客様の全データからの分析情報の検知が大幅に拡張され、お客様のインテリジェント アプリに機械学習モデルを適用できるようになりました。

Azure Open Datasets が一般提供されたため、Azure でホストされた、Azure Machine Learning ワークスペースから簡単にアクセスできるキュレーションされたデータセットが提供され、モデル トレーニングが促進されます。社会経済データ、衛星画像など、25 を超えるデータセットが利用可能になりました。新しいデータセットは継続的に追加されており、追加のデータセットを Azure に推薦できます。

安全な基盤の上に構築

「Azure Machine Learning のおかげで、データ サイエンティスト チームは、業界標準の信頼とコンプライアンスによってサポートされた環境で作業することができます。RBAC、VNet、Key Vault などのエンタープライズ対応機能でリソースを詳細に管理し、生産性を向上させる安全なプラットフォームでイノベーションを実現できるため、チームはインフラストラクチャやセットアップではなく、機械学習のタスクに注力できます。」- KPMG LLP 社 Ignition Tax 担当マネージャー  Cary Goltermann 氏。

セキュリティおよびエンタープライズ対応の更新

ワークスペース容量管理 (現在プレビュー段階) は、サブスクリプション内のワークスペースとクラスター全体で効率的なリソース配分ができているかどうか、管理者がコンピューティング使用量を確認するのに役立ちます。容量の管理とガバナンス用にリソースを再割り当てするために、容量制限を設定できます。ロール ベースのアクセスの制御 (RBAC) (プレビュー段階) では、詳細なアクセス制御を行うためのカスタム ロールの定義を支援し、高度なセキュリティ シナリオをサポートします。仮想ネットワーク (VNet) (プレビュー段階) では、推論を通して実験を実行する際に、モデルのトレーニングとデプロイに使用されるコンピューティング リソースを分離するためのセキュリティ境界が設けられます。

公平性:データ サイエンティストと開発者は、透過性とモデルの理解をサポートする Azure Machine Learning のモデルの解釈可能性に加え、新しいオープンソースの公平性評価および軽減ツールである Fairlearn を利用できるようになりました。このツールは、直感的で構成可能な視覚化セットを通じて、組織がモデル予測の公平性に関する分析情報を得るのに役立ちます。

 

公平性機能は、サブグループ (この場合は性別に基づく) にわたる予測の不均衡を示す視覚化など、モデルの公平性に関する分析情報を得るのに役立ちます。

公平性機能の分析情報

今日から作成を始めましょう

機械学習があらゆるスキル レベルで利用可能になる新しい生産性エクスペリエンスから、オープンで信頼されたプラットフォーム上に構築された堅牢な MLOps およびエンタープライズ レベルのセキュリティまで、機械学習のライフサイクルを後押しするための機能をご利用いただけます。Microsoft はお客様のビジネスとアプリケーションをサポートし、AI によってビジネスの変革を促進するために、機械学習への継続的な投資に取り組んでいます。


Azure。目的を持って創造する