預測患者停留和流程的長度

Azure Data Factory
Azure Data Lake 儲存體
Azure Machine Learning
Azure Synapse Analytics
Power BI

此 Azure 解決方案可協助醫院系統管理員使用機器學習功能來預測醫院內許可的保留時間長度,以改善容量規劃和資源使用率。 醫療資訊長可能會使用預測模型來判斷哪些設施已超額,以及哪些資源可在這些設施內強化。 護線管理員可能會使用模型來判斷是否有適當的員工資源來處理病患的釋放。

架構

使用醫療保健裝置和 Azure 服務的遠端病患監視架構圖表。

下載這個架構的 Visio 檔案

資料流程

下列資料流程對應至上圖:

  1. 電子健康情況記錄 (EHR) 和電子醫療記錄 (EMR) 的匿名健康情況資料會 Azure Data Factory搭配適當的運行 (時間擷取,例如:Azure、自我裝載) 。 在此案例中,我們假設可以使用其中一個Azure Data Factory連接器進行批次擷取,例如 ODBC、Oracle、SQL。 FHIR 資料等其他資料來源可能需要包含中繼擷取服務,例如Azure Functions。

  2. Azure Data Factory資料流程至 Azure Data Lake Storage (gen 2) 。 此程式期間不會Azure Data Factory儲存任何資料,而且在此步驟期間可以處理/重試中斷連線之類的失敗。

  3. Azure Machine Learning 可用來將機器學習演算法/管線套用至 步驟 2 中所內嵌的資料。 演算法可以根據需求,根據事件、排程或手動套用。 具體來說,這包括:

    3.1 訓練 - 擷取的資料是用來使用線性回歸和漸層提升決策樹等演算法組合來定型機器學習模型。 這些演算法是透過各種架構提供 (,例如 scikit-learn) 通常是在管線中,而且可能包含前置/後置處理管線步驟。 例如,來自現有預先處理 (之許可類型的病患健康情況因素,例如,卸載 null 資料列) EMR/EHR 資料可用來定型回歸模型,例如線性回歸。 然後,模型就能夠預測新的病患保留長度。

    3.2 驗證 - 模型效能會與現有的模型/測試資料進行比較,以及針對任何下游取用目標,例如應用程式程式設計介面 (API) 。

    3.3 部署 - 模型會使用容器封裝,以用於不同的目標環境。

    3.4 監視器 - 收集並監視模型預測,以確保效能不會隨著時間降低。 您可以視需要使用此監視資料,將警示傳送至觸發手動或自動重新定型/更新至模型。 請注意,可能需要其他 Azure 監視器等服務,視擷取的監視資料類型而定。

  4. Azure Machine Learning 輸出會流向 Azure Synapse Analytics。 模型輸出 (預測的病患長度,) 會與可調整且服務層中的現有病患資料結合,例如專用 SQL 集區以供下游取用。 目前可透過 Synapse Analytics 完成其他分析,例如每個醫院的平均保留長度。

  5. Azure Synapse Analytics 將資料提供給 Power BI。 具體而言,Power BI 會連線到步驟 (4) 中的服務層,以擷取資料並套用所需的其他語意模型。

  6. Power BI 用於 由醫療保健行管理員和醫院資源協調器進行分析。

單元

  • Azure Data Factory (ADF) 提供完全受控、無伺服器資料整合和協調流程服務,能夠以視覺化方式將資料來源與超過 90 個內建、無維護的連接器整合,不加成本。 在此案例中,ADF 可用來內嵌資料並協調資料流程。

  • Azure Data Lake (ADLS) 提供可調整的安全資料湖,以進行高效能分析。 在此案例中,ADLS 會當做可調整且符合成本效益的資料儲存層使用。

  • Azure Machine Learning (AML) 服務可透過下列方式加速端對端 LOS 預測機器學習生命週期:

    • 讓資料科學家和開發人員擁有各種不同的生產力體驗,以建置、定型和部署機器學習模型,並促進小組共同作業。
    • 使用領先業界的 MLOps 加速上市時間—機器學習作業或適用于機器學習的 DevOps。
    • 在安全、受信任的平臺上創新,專為負責的機器學習而設計。

    在此案例中,AML 是用來產生用來預測病患保留長度的模型,以及管理端對端模型生命週期的服務。

  • Azure Synapse Analytics:一項無限制的分析服務,可將資料整合、企業資料倉儲和巨量資料分析整合在一起。 在此案例中,Synapse 可用來將模型預測併入現有的資料模型中,並提供高速服務層以供下游取用。

  • Power BI 提供企業級自助式分析,可讓您:

    • 建立具有所有商業智慧的資料驅動文化。
    • 使用領先業界的資料安全性功能保護您的資料安全,包括敏感度標籤、端對端加密,以及即時存取監視。

    在此案例中,Power BI 可用來建立使用者儀表板,並套用這些儀表板中所需的任何語意模型。

替代方案

  • Azure Synapse Analytics Spark 和Azure Databricks等 Spark 服務可用來作為執行機器學習的替代方案,視資料科學小組的資料規模和技能集而定。
  • MLFlow 可用來根據客戶技能集/環境來管理端對端生命週期,作為 Azure Machine Learning 的替代方案。
  • Azure Synapse Analytics管線可用來作為大部分情況下Azure Data Factory的替代方案,主要視特定客戶環境而定。

實例詳細資料

對於執行醫療保健設施的人員而言, (LOS) 的保留長度—患者許可到治療的天數—很重要。 不過,該數目可能會因疾病狀況和特製而有所不同,即使是在相同的醫療保健系統中,也很難追蹤病患流程並據以規劃。

此解決方案可針對醫院內許可啟用 LOS 的預測模型。 LOS 定義于初始允許日期到病患從任何指定的醫院設施中釋放的日期起的天數。 即使在相同的醫療保健系統中,各種設施、疾病狀況和特殊功能之間,LOS 可能會有顯著的變化。

病患 長度是否與醫療保健品質相關? 等研究顯示,經過風險調整較長的 LOS 與較低接收的醫療保健品質相互關聯。 在許可時,進階 LOS 預測可藉由提供提供者的預期 LOS,藉此提升病患的照護品質,讓提供者能夠用來做為與目前病患 LOS 進行比較的計量。 這有助於確保患者超過預期的 LOS 收到適當的注意。 LOS 預測也有助於精確規劃出口,進而降低各種其他品質量值,例如重新委任。

潛在使用案例

醫院管理中有兩個不同的商務使用者,可預期能受益于更可靠的保留時間預測,以及病患的家族:

  • 醫療資訊長 (CMIO) ,其會跨醫療保健組織中的資訊/技術與醫療保健專業人員之間的差異。 其職責通常包括流量分析來判斷資源是否適當地配置在醫院網路中。 CMIO 必須能夠判斷哪些設施已超載,特別是那些設施上的哪些資源可能需要強化,才能視需要重新命名這類資源。
  • 負責直接參與病患照護的醫療保健主管。 此角色需要監視個別病患的狀態,並確保員工能夠符合其病患的特定照護需求。 護線經理可以做出精確的醫療決策,並事先適當地對齊正確的資源。 例如,預測 LOS 的能力:
    • 作為病患風險的初始評估,對於更好的 資源規劃和配置而言非常重要,特別是當資源受到限制時,如同 ICU。
    • 可讓護線管理員判斷員工資源是否足以處理病患的釋放。
  • 預測 ICU 中的 LOS 也對病患及其家庭以及保險公司有所説明。 來自醫院的疾病預期日期可協助患者及其家庭瞭解及估計醫療成本。 這也可讓家庭瞭解病患的復原速度,並協助他們規劃疾病並管理其預算。

考量

這些考慮會實作 Azure Well-Architected Framework 的要素,這是一組可用來改善工作負載品質的指引原則。 如需詳細資訊,請參閱 Microsoft Azure Well-Architected Framework

成本最佳化

成本最佳化是關於考慮如何減少不必要的費用,並提升營運效率。 如需詳細資訊,請參閱成本最佳化要素的概觀

此解決方案最昂貴的元件是計算,而且有數種方式可透過資料量以符合成本效益的方式調整計算。 其中一個範例是針對資料工程工作使用 Spark 服務,例如Azure Synapse Analytics Spark 或 Azure Databricks,而不是單一節點解決方案。 Spark 會水準調整,而且相較于大型、垂直調整的單一節點解決方案,更具成本效益。

您可以在此 Azure 定價計算機已儲存的預估中找到此架構中所設定之所有 Azure 元件的定價。 此估計值會設定為顯示預估的預付和每月成本,這是執行星期一到星期五上午 9 點到星期五的基本實作。

卓越營運

營運卓越涵蓋部署應用程式的作業程式,並將它保留在生產環境中執行。 如需詳細資訊,請參閱 營運卓越要素概觀

MLOps (實作 (機器學習作業) 實務和實作在這類解決方案的生產化中扮演重要角色。 如需詳細資訊,請參閱 機器學習作業 (MLOps)

效能效率

效能效率可讓您的工作負載進行調整,以有效率的方式符合使用者對其放置的需求。 如需詳細資訊,請參閱效能效率要件概觀

在此案例中,會在 Azure Machine Learning 中執行資料前置處理。 雖然此設計適用于小型到中型資料磁片區,但具有近乎即時 SLA 的大型資料量或案例可能會從效能的觀點來看困難。 解決這類問題的方法之一,就是使用 Spark 服務,例如 Azure Synapse Analytics Spark 或 Azure Databricks,以進行資料工程或資料科學工作負載。 Spark 會水準調整,並依設計散發,讓它能夠非常有效地處理大型資料集。

安全性

安全性可提供保證,以避免刻意攻擊和濫用您寶貴的資料和系統。 如需詳細資訊,請參閱安全性要素的概觀

重要

此架構可搭配匿名和非匿名的健康情況資料使用。 不過,為了安全實作,我們建議健康情況資料以 EHR 和 EMR 來源的匿名形式提供。

如需 Azure Machine Learning 可用安全性和治理功能的詳細資訊,請參閱 Azure Machine Learning 的企業安全性和治理

參與者

本文由 Microsoft 維護。 它原本是由下列參與者所撰寫。

主要作者:

若要查看非公用LinkedIn設定檔,請登入 LinkedIn。

下一步

與實作此架構相關的技術和資源:

請參閱與此架構相關的其他 Azure 架構中心內容: