Förutsäga patientens längd på vistelse och flöde

Azure Data Factory
Azure Data Lake Storage
Azure Machine Learning
Azure Synapse Analytics
Power BI

Den här Azure-lösningen hjälper sjukhusadministratörer att använda maskininlärningskraften för att förutsäga längden på vistelsen för sjukhusinläggningar, för att förbättra kapacitetsplaneringen och resursutnyttjandet. En chefsläkare för medicinsk information kan använda en förutsägelsemodell för att avgöra vilka anläggningar som är överbeskattade och vilka resurser som ska stärkas inom dessa anläggningar. En vårdlinjechef kan använda en modell för att avgöra om det finns tillräckliga personalresurser för att hantera frisättningen av en patient.

Arkitektur

Diagram över fjärrövervakningsarkitektur för patienter med hjälp av sjukvårdsenheter och Azure-tjänster.

Ladda ned en Visio-fil med den här arkitekturen.

Dataflöde

Följande dataflöde motsvarar diagrammet ovan:

  1. Anonymiserade hälsodata från elektroniska hälsojournaler (EHR) och elektroniska journaler (EMR) extraheras med hjälp av Azure Data Factory med lämplig körning (till exempel Azure, lokalt installerad). I det här scenariot antar vi att anonymiserade data är tillgängliga för batchextrahering med någon av Azure Data Factory anslutningsappar, till exempel ODBC, Oracle, SQL. Andra datakällor, till exempel FHIR-data, kan kräva att en mellanliggande inmatningstjänst som Azure Functions inkluderas.

  2. Azure Data Factory data flödar genom Data Factory till Azure Data Lake Storage (gen 2). Inga data lagras i Azure Data Factory under den här processen, och fel som avbrutna anslutningar kan hanteras/försökas igen under det här steget.

  3. Azure Machine Learning används för att tillämpa maskininlärningsalgoritmer/pipelines på data som matas in i steg 2. Algoritmerna kan tillämpas på händelsebasis, schemaläggs eller manuellt beroende på kraven. Mer specifikt omfattar detta:

    3.1 Träna – Inmatade data används för att träna en maskininlärningsmodell med hjälp av en kombination av algoritmer som Linjär regression och Gradient Boosted Decision Tree. Dessa algoritmer tillhandahålls via olika ramverk (till exempel scikit-learn) vanligtvis i en pipeline och kan innehålla pipelinesteg före/efter bearbetning. Till exempel kan patienthälsofaktorer som antagningstyp som kommer från befintliga förbehandlade (till exempel ta bort nullrader) EMR/EHR-data användas för att träna en regressionsmodell som linjär regression. Modellen skulle då kunna förutsäga en ny patientlängd.

    3.2 Verifiera – Modellens prestanda jämförs med befintliga modeller/testdata, och även mot eventuella underordnade förbrukningsmål, till exempel API:er (Application Programming Interfaces).

    3.3 Distribuera – Modellen paketeras med en container för användning i olika målmiljöer.

    3.4 Övervaka – Modellförutsägelser samlas in och övervakas för att säkerställa att prestanda inte försämras med tiden. Aviseringar kan skickas för att utlösa manuell eller automatisk omträning/uppdateringar av modellen efter behov med hjälp av dessa övervakningsdata. Observera att ytterligare tjänster som Azure Monitor kan behövas, beroende på vilken typ av övervakningsdata som extraheras.

  4. Azure Machine Learning-utdata flödar till Azure Synapse Analytics. Modellutdata (förutsagd patientlängd för vistelse) kombineras med befintliga patientdata i ett skalbart, betjänande lager som dedikerad SQL-pool för nedströmsförbrukning. Ytterligare analyser, till exempel genomsnittlig vistelselängd per sjukhus, kan göras via Synapse Analytics just nu.

  5. Azure Synapse Analytics tillhandahåller data till Power BI. Mer specifikt ansluter Power BI till serveringslagret i steg (4) för att extrahera data och tillämpa ytterligare semantisk modellering som behövs.

  6. Power BI används för analys av vårdlinjechefen och sjukhusresurskoordinatorn.

Komponenter

  • Azure Data Factory (ADF) tillhandahåller en fullständigt hanterad, serverlös dataintegrerings- och orkestreringstjänst som kan integrera datakällor visuellt med över 90 inbyggda, underhållsfria anslutningsappar utan extra kostnad. I det här scenariot används ADF för att mata in data och samordna dataflödena.

  • Azure Data Lake (ADLS) ger en skalbar säker datasjö för analys med höga prestanda. I det här scenariot används ADLS som ett skalbart och kostnadseffektivt datalagringslager.

  • Azure Machine Learning-tjänster (AML) påskyndar livscykeln för maskininlärning från slutpunkt till slutpunkt för LOS-förutsägelse genom att:

    • Ge dataexperter och utvecklare tillgång till en mängd olika produktiva upplevelser för att skapa, träna och distribuera maskininlärningsmodeller och främja teamsamarbete.
    • Snabbare tid till marknad med branschledande MLOps – maskininlärningsåtgärder eller DevOps för maskininlärning.
    • Förnya på en säker, betrodd plattform, utformad för ansvarsfull maskininlärning.

    I det här scenariot är AML den tjänst som används för att producera modellen som används för att förutsäga patientens vistelselängd och för att hantera livscykeln för modellen från slutpunkt till slutpunkt.

  • Azure Synapse Analytics: en obegränsad analystjänst som sammanför dataintegrering, lagring av företagsdata och stordataanalys. I det här scenariot används Synapse för att införliva modellförutsägelserna i den befintliga datamodellen och även för att tillhandahålla ett servicelager med hög hastighet för nedströmsförbrukning.

  • Power BI tillhandahåller självbetjäningsanalyser i företagsskala, så att du kan:

    • Skapa en datadriven kultur med business intelligence för alla.
    • Skydda dina data med branschledande funktioner för datasäkerhet, inklusive känslighetsetiketter, kryptering från slutpunkt till slutpunkt och övervakning av åtkomst i realtid.

    I det här scenariot används Power BI för att skapa slutanvändarinstrumentpaneler och tillämpa all semantisk modellering som behövs på dessa instrumentpaneler.

Alternativ

  • Spark-tjänster som Azure Synapse Analytics Spark och Azure Databricks kan användas som ett alternativ för att utföra maskininlärningen, beroende på dataforskningsteamets dataskala och kompetensuppsättning.
  • MLFlow kan användas för att hantera livscykeln från slutpunkt till slutpunkt som ett alternativ till Azure Machine Learning beroende på kundens kompetensuppsättning/miljö.
  • Azure Synapse Analytics-pipelines kan användas som ett alternativ till Azure Data Factory i de flesta fall, beroende till stor del på den specifika kundmiljön.

Scenarioinformation

För de personer som driver en vårdinrättning är längden på vistelsen (LOS) – antalet dagar från patientintagning till utskrivning – viktigt. Det antalet kan dock variera mellan anläggningar och över sjukdomstillstånd och specialiteter, även inom samma sjukvårdssystem, vilket gör det svårt att spåra patientflödet och planera därefter.

Den här lösningen möjliggör en förutsägelsemodell för LOS för sjukhusinläggningar. LOS definieras i antal dagar från det första intagningsdatumet till det datum då patienten skrivs ut från en viss sjukhusanläggning. Det kan finnas betydande variation av LOS över olika anläggningar, sjukdomstillstånd och specialiteter, även inom samma sjukvårdssystem.

Studier som Är patientens vistelsetid relaterad till vårdkvalitet? har visat att en längre riskjusterad LOS är korrelerad med lägre mottagen vårdkvalitet. Avancerad LOS-förutsägelse vid tidpunkten för antagning kan förbättra patientens vårdkvalitet genom att ge leverantörer en förväntad LOS som de kan använda som ett mått för att jämföra med nuvarande patient LOS. Detta kan hjälpa till att säkerställa att patienter med längre än förväntat LOS får lämplig uppmärksamhet. LOS-förutsägelse hjälper också till med korrekt planering för utsläpp som resulterar i sänkning av olika andra kvalitetsmått, till exempel återtaganden.

Potentiella användningsfall

Det finns två olika företagsanvändare inom sjukhusledningen som kan förvänta sig att dra nytta av mer tillförlitliga förutsägelser om vistelsens längd, liksom patienternas familjer:

  • Chief Medical Information Officer (CMIO), som sträcker sig över klyftan mellan informatik/teknik och sjukvårdspersonal i en sjukvårdsorganisation. Deras uppgifter omfattar vanligtvis att använda analys för att avgöra om resurser allokeras på lämpligt sätt i ett sjukhusnätverk. CMIO måste kunna fastställa vilka anläggningar som överbeskattas, och särskilt vilka resurser på dessa anläggningar som kan behöva stärkas för att justera sådana resurser med efterfrågan.
  • Vårdlinjens chef, som är direkt involverad i vården av patienter. Denna roll kräver övervakning av enskilda patienters status och säkerställa att personalen är tillgänglig för att uppfylla de specifika vårdkraven för sina patienter. Vårdlinjens chef kan fatta korrekta medicinska beslut och anpassa rätt resurser i god tid. Till exempel möjligheten att förutsäga LOS:
    • som en första bedömning av patienternas risk är avgörande för bättre resursplanering och allokering, särskilt när resurserna är begränsade, som i IKU:er.
    • gör det möjligt för vårdledningschefer att avgöra om personalresurserna kommer att vara tillräckliga för att hantera frisättningen av en patient.
  • Att förutsäga LOS i ICU är också fördelaktigt för patienter och deras familjer, liksom försäkringsbolag. Ett förväntat datum för utskrivning från sjukhuset hjälper patienter och deras familjer att förstå och uppskatta medicinska kostnader. Detta ger också familjer en uppfattning om en patients återhämtningshastighet och hjälper dem att planera för ansvarsfrihet och hantera sina budgetar.

Överväganden

Dessa överväganden implementerar grundpelarna i Azure Well-Architected Framework, som är en uppsättning vägledande grundsatser som kan användas för att förbättra kvaliteten på en arbetsbelastning. Mer information finns i Microsoft Azure Well-Architected Framework.

Kostnadsoptimering

Kostnadsoptimering handlar om att titta på sätt att minska onödiga utgifter och förbättra driftseffektiviteten. Mer information finns i Översikt över grundpelare för kostnadsoptimering.

Den dyraste komponenten i den här lösningen är beräkningen och det finns flera sätt att skala beräkningen kostnadseffektivt med datavolymen. Ett exempel är att använda en Spark-tjänst som Azure Synapse Analytics Spark eller Azure Databricks för datateknikarbetet, till skillnad från en enskild nodlösning. Spark skalas horisontellt och är mer kostnadseffektivt jämfört med stora, vertikalt skalbara lösningar med en nod.

Prissättningen för alla Azure-komponenter som konfigurerats i den här arkitekturen finns i den här sparade uppskattningen för Azure-priskalkylatorn. Den här uppskattningen är konfigurerad för att visa de uppskattade start- och månadskostnaderna för en grundläggande implementering som körs 09:00–17:00 måndag till fredag.

Utmärkt driftseffektivitet

Utmärkt drift omfattar de driftsprocesser som distribuerar ett program och håller det igång i produktion. Mer information finns i Översikt över grundpelare för driftseffektivitet.

En solid MLOps-metod (Machine Learning Operations) och implementering spelar en viktig roll i produktionen av den här typen av lösning. Mer information finns i Maskininlärningsåtgärder (MLOps).

Prestandaeffektivitet

Prestandaeffektivitet handlar om att effektivt skala arbetsbelastningen baserat på användarnas behov. Mer information finns i Översikt över pelare för prestandaeffektivitet.

I det här scenariot utförs förbearbetning av data i Azure Machine Learning. Den här designen fungerar för små till medelstora datavolymer, men stora datavolymer eller scenarier med serviceavtal i nära realtid kan ha svårt ur prestandasynpunkt. Ett sätt att hantera den här typen av problem är att använda en Spark-tjänst som Azure Synapse Analytics Spark eller Azure Databricks för datateknik eller datavetenskapsarbetsbelastningar. Spark skalas horisontellt och distribueras avsiktligt, vilket gör att stora datauppsättningar kan bearbetas mycket effektivt.

Säkerhet

Säkerhet ger garantier mot avsiktliga attacker och missbruk av värdefulla data och system. Mer information finns i Översikt över säkerhetspelare.

Viktigt

Den här arkitekturen fungerar med både anonymiserade och icke-anonymiserade hälsodata. Men för en säker implementering rekommenderar vi att hälsodata hämtas i anonymiserad form från EHR- och EMR-källor.

Mer information om säkerhets- och styrningsfunktioner som är tillgängliga för Azure Machine Learning finns i Företagssäkerhet och styrning för Azure Machine Learning

Deltagare

Den här artikeln underhålls av Microsoft. Den skrevs ursprungligen av följande deltagare.

Huvudförfattare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.

Nästa steg

Tekniker och resurser som är relaterade till implementering av den här arkitekturen:

Se ytterligare Azure Architecture Center-innehåll som är relaterat till den här arkitekturen: