入院期間と患者の流れの予測

Azure Data Factory
Azure Data Lake Storage
Azure Machine Learning
Azure Synapse Analytics
Power BI

病院管理者がこの Azure ソリューションを使うと、機械学習の力を利用して、入院期間を予測し、収容計画とリソース使用率を改善できます。 最高医療情報責任者は、予測モデルを使用して、どの施設が過負荷になっているか、およびそれらの施設内でどのリソースを強化するかを判断することができます。 ケア ライン マネージャーは、モデルを使用して、患者の退院を処理するのに十分なスタッフ リソースが揃っているかどうかを判断できます。

アーキテクチャ

医療デバイスと Azure サービスを使用したリモート患者モニタリング アーキテクチャの図。

このアーキテクチャの Visio ファイルをダウンロードします。

データフロー

次のデータフローは、上記の図に対応しています。

  1. 電子健康記録 (EHR) と電子医療記録 (EMR) からの匿名化された健康データが、Azure Data Factory と適切なランタイム (Azure、セルフホステッドなど) を使用して抽出されます。 このシナリオでは、匿名化されたデータに、ODBC、Oracle、SQL などの Azure Data Factory コネクタのいずれかを使用してバッチ抽出のためにアクセスできるものとします。 FHIR データなどの他のデータ ソースでは、Azure Functions などの中間インジェスト サービスを含める必要がある場合があります。

  2. Azure Data Factory データは Data Factory を経由して Azure Data Lake Storage (Gen 2) に流れます。 このプロセス中にデータは Azure Data Factory に格納されません。この手順では、切断された接続などのエラーを処理または再試行できます。

  3. Azure Machine Learning を使用して、手順 2 で取り込んだデータに機械学習アルゴリズムまたはパイプラインを適用します。 要件に応じて、アルゴリズムは、イベントベースで、スケジュール設定して、または手動で適用できます。 具体的には、次のものが含まれます。

    3.1 トレーニング - 取り込まれたデータは、線形回帰や勾配ブースティング デシジョン ツリーなどのアルゴリズムの組み合わせを使用して機械学習モデルをトレーニングするために使用されます。 これらのアルゴリズムは、通常はパイプライン内で、さまざまなフレームワーク (scikit-learn など) を介して提供され、前または後処理パイプライン ステップが含まれる場合があります。 たとえば、既存の前処理済み (null 行のドロップなど) の EMR または EHR データから取得される入院タイプなどの患者の健康要因を使用して、線形回帰などの回帰モデルをトレーニングできます。 その後、モデルは新しい患者の入院期間を予測できるようになると考えられます。

    3.2 検証 - モデルのパフォーマンスは、既存のモデルまたはテスト データと比較されます。これは、アプリケーション プログラミング インターフェイス (API) などのダウンストリーム消費ターゲットに対しても行われます。

    3.3 デプロイ - モデルは、さまざまなターゲット環境で使用するためにコンテナーを使用してパッケージ化されます。

    3.4 監視 - モデルの予測が収集され、時間の経過と共にパフォーマンスが低下しないように監視されます。 この監視データを使用して、必要に応じてモデルへの手動か自動の再トレーニングまたは更新をトリガーするために、アラートを送信できます。 抽出される監視データの種類によっては、Azure Monitor などの追加サービスが必要になる場合があることにご注意ください。

  4. Azure Machine Learning の出力が Azure Synapse Analytics に送られます。 モデル出力 (予測される患者の入院期間) は、ダウンストリームでの使用のために、専用 SQL プールのようなスケーラブルなサービス レイヤー内の既存の患者データと組み合わされます。 病院ごとの平均入院期間などの追加の分析は、この時点で Synapse Analytics を使用して行うことができます。

  5. Azure Synapse Analytics は Power BI にデータを提供します。 具体的には、Power BI は手順 (4) でサービス レイヤーに接続してデータを抽出し、必要なセマンティック モデリングを追加適用します。

  6. Power BI は、ケア ライン マネージャーと病院リソース コーディネーターによる分析に使用されます

Components

  • Azure Data Factory (ADF) は、フル マネージドのサーバーレス データ統合とオーケストレーション サービスを提供し、90 を超える組み込みのメンテナンスフリー コネクタでデータ ソースを追加コストなしで視覚的に統合できます。 このシナリオでは、ADF を使用してデータを取り込み、データ フローを調整します。

  • Azure Data Lake (ADLS) は、ハイ パフォーマンスの分析用のスケーラブルで安全なデータ レイクを提供します。 このシナリオでは、ADLS はスケーラブルでコスト効率の高いデータ ストレージ レイヤーとして使用されます。

  • Azure Machine Learning (AML) サービスは、次の方法でエンド ツー エンドの LOS 予測機械学習ライフサイクルを加速します。

    • 機械学習モデルを構築、トレーニング、デプロイし、チーム コラボレーションを促進するための、幅広い生産性の高いエクスペリエンスによって、データ サイエンティストと開発者を支援します。
    • 業界をリードする MLOps (機械学習の運用、または機械学習用 DevOps) を使用して、市場投入までの時間を短縮します。
    • 責任ある機械学習用に設計された、セキュリティで保護された信頼できるプラットフォームで、イノベーションを起こします。

    このシナリオで、AML は、患者の入院期間を予測し、エンドツーエンドのモデル ライフサイクルを管理するために使用されるモデルを生成するために使用されるサービスです。

  • Azure Synapse Analytics: データ統合、エンタープライズ データ ウェアハウス、ビッグ データ分析を 1 つにまとめた無制限の分析サービスです。 このシナリオでは、Synapse を使用して、モデル予測を既存のデータ モデルに組み込むとともに、ダウンストリームで使用するための高速サービス レイヤーも提供します。

  • Power BI では、エンタープライズ規模でセルフサービス分析が提供され、次のことが可能になります。

    • すべての人のために、ビジネス インテリジェンスによるデータ駆動型のカルチャを創造します。
    • 秘密度ラベル付け、エンドツーエンドの暗号化、リアルタイムのアクセス監視など、業界をリードするデータ セキュリティ機能を使用して、データをセキュリティで保護します。

    このシナリオでは、Power BI を使用してエンド ユーザー ダッシュボードを作成し、それらのダッシュボードで必要なセマンティック モデリングを適用します。

代替

  • データ スケールとデータ サイエンス チームのスキル セットに応じて、Azure Synapse Analytics Spark や Azure Databricks などの Spark サービスを、機械学習を実行するための代替手段として使用できます。
  • 顧客のスキルセットまたは環境に応じて、MLflow を Azure Machine Learning の代替手段として使用して、エンド ツー エンドのライフサイクルを管理できます。
  • Azure Synapse Analytics パイプラインは、ほとんどの場合に Azure Data Factory の代わりに使用できますが、これは特定の顧客環境に大きく左右されます。

シナリオの詳細

医療施設を経営する方にとって、入院期間 (LOS、患者の入院から退院までの日数) は重要です。 ただし、その数値は、同じ医療システム内でも、設備、病気の条件、専門分野によって異なる可能性があるため、患者の流れを追跡し、それに応じて計画することは困難です。

このソリューションにより、入院時の LOS の予測モデルが可能になります。 LOS は、患者の入院初日から、特定の病院施設を退院するまでの日数で定義されます。 同じ医療システム内であっても、医療施設、病状、専門分野によって、LOS が大きく異なる場合があります。

患者の入院期間はケアの質に関連しているか?」などの研究は、リスク調整された LOS の長期化と受けるケアの質の低下は相関していることを示しています。 入院時に高度な LOS 予測ができると、医療提供者は現在の患者の LOS と比較するメトリックとして使用できる予想 LOS が得られて、患者のケアの質の向上につながり得ます。 これは、予想以上に LOS が長引いている患者が適切な注意を受けられるようにするのに役立ちます。 LOS 予測は退院を正確に計画するうえでも役立ち、結果として再入院などの他のさまざまな品質指標を下げることができます。

考えられるユース ケース

病院管理には、患者家族の他にも、入院期間の予測の信頼性が向上することでメリットが得られると考えられる、2 種類のビジネス ユーザーがいます。

  • 医療機関において情報科学または技術の専門家と医療従事者との境界線上に位置する、最高医療情報責任者 (CMIO)。 通常、CMIO の任務には、分析を使用して、病院ネットワーク内でリソースが適切に割り当てられているかどうかを判断することが含まれます。 CMIO は、過大な負荷がかかっている施設を特定できる必要があります。具体的には、それらの施設で強化する必要があるリソースを特定し、需要に合わせてそれらのリソースを再調整する必要があります。
  • 患者のケアに直接関与するケア ライン マネージャー。 この役割は、個々の患者の状態を監視し、患者の特定のケア要件に対応するためのスタッフを確保する必要があります。 ケア ライン マネージャーは、正確な医療上の意思決定を行い、適切なリソースを事前に調整することができます。 たとえば、LOS を予測できるなら、次のことが言えます。
    • 患者のリスクの初期評価となり、これはリソース計画と割り当てを向上させるうえで重要です。特に、ICU のようにリソースが限られている場合はそう言えます。
    • ケア ライン マネージャーが、患者の退院に対応するスタッフ リソースが適切かどうかを判断できるようになります。
  • ICU での LOS の予測は、患者とその家族だけでなく、保険会社にも役立ちます。 病院からの退院予定日は、患者とその家族が医療コストを理解し、見積もるのに役立ちます。 これにより、家族は患者の回復速度をイメージすることもでき、彼らが退院の計画を立て、予算を管理するのに役立ちます。

考慮事項

これらの考慮事項は、ワークロードの品質向上に使用できる一連の基本原則である Azure Well-Architected Framework の要素を組み込んでいます。 詳細については、「Microsoft Azure Well-Architected Framework」を参照してください。

コスト最適化

コストの最適化とは、不要な費用を削減し、運用効率を向上させる方法を検討することです。 詳しくは、コスト最適化の柱の概要に関する記事をご覧ください。

このソリューションの最もコストの高いコンポーネントはコンピューティングであり、データ量に応じてコンピューティングをコスト効率良くスケーリングする方法はいくつかあります。 1 つの例として、単一ノード ソリューションではなく、Azure Synapse Analytics Spark や Azure Databricks などの Spark サービスをデータ エンジニアリング作業に使用する方法が挙げられます。 Spark は水平方向にスケーリングされ、垂直方向にスケーリングされた大規模な単一ノード ソリューションに比べてコスト効率が高くなります。

このアーキテクチャで構成されているすべての Azure コンポーネントの価格については、この Azure 料金計算ツールの保存済み見積もりを参照してください。 この見積もりは、月曜日から金曜日の午前 9 時から午後 5 時まで実行される基本的な実装について、前払いと月次のコストの見積もりを表示するように構成されています。

オペレーショナル エクセレンス

オペレーショナル エクセレンスは、アプリケーションをデプロイし、それを運用環境で実行し続ける運用プロセスをカバーします。 詳細については、「オペレーショナル エクセレンスの重要な要素の概要」を参照してください。

堅実な機械学習の運用 (MLOps) の実践と実装は、この種のソリューションの実稼働化において重要な役割を果たします。 詳細については、「機械学習の運用 (MLOps)」を参照してください。

パフォーマンス効率

パフォーマンス効率とは、ユーザーによって行われた要求に合わせて効率的な方法でワークロードをスケーリングできることです。 詳細については、「パフォーマンス効率の柱の概要」を参照してください。

このシナリオでは、Azure Machine Learning でデータの前処理が実行されます。 この設計は小規模から中規模のデータ ボリュームでは効果的ですが、大規模なデータ ボリュームや凖リアルタイムの SLA のシナリオへの対応は、パフォーマンスの観点から困難な場合があります。 この種の問題に対処する方法の 1 つは、データ エンジニアリングまたはデータ サイエンスのワークロードに Azure Synapse Analytics Spark や Azure Databricks などの Spark サービスを使用することです。 Spark は水平方向にスケーリングされ、分散型の設計であるため、大規模なデータセットを非常に効率的に処理できます。

セキュリティ

セキュリティは、重要なデータやシステムの意図的な攻撃や悪用に対する保証を提供します。 詳細については、「セキュリティの重要な要素の概要」を参照してください。

重要

このアーキテクチャは健康データが匿名化されていても匿名化されていなくても機能します。 ただし、セキュリティで保護された実装のために、健康データは EHR および EMR ソースから匿名化された形式で供給することをお勧めします。

Azure Machine Learning で使用できるセキュリティとガバナンスの機能の詳細については、「Azure Machine Learning のエンタープライズ セキュリティとガバナンス」を参照してください。

共同作成者

この記事は、Microsoft によって保守されています。 当初の寄稿者は以下のとおりです。

プリンシパルの作成者:

  • Dhanshri More | プリンシパル クラウド ソリューション アーキテクト
  • DJ Dean | プリンシパル クラウド ソリューション アーキテクト

パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。

次の手順

このアーキテクチャの実装に関連するテクノロジとリソース:

このアーキテクチャに関連する追加の Azure アーキテクチャ センター コンテンツを参照してください。