Modifier

Prédire la durée de séjour et le flux des patients

Azure Data Factory
Azure Data Lake Storage
Azure Machine Learning
Azure Synapse Analytics
Power BI

Cette solution Azure aide les administrateurs d’hôpitaux à utiliser la puissance de l’apprentissage automatique pour prévoir la durée de séjour des admissions afin d’améliorer la planification des capacités et l’utilisation des ressources. Un responsable de l’information médicale peut utiliser un modèle prédictif pour déterminer quelles installations sont surchargées et quelles ressources il faut renforcer dans ces installations. Un manager de ligne de soins peut utiliser un modèle pour déterminer si les ressources en personnel sont suffisantes pour gérer la sortie d’un patient.

Architecture

Diagramme de l’architecture de monitoring des patients à distance avec des appareils de santé et des services Azure.

Téléchargez un fichier Visio de cette architecture.

Dataflow

Le flux de données suivant correspond au diagramme ci-dessus :

  1. Les données d’intégrité anonymes des dossiers médicaux électroniques (EHR) et des dossiers médicaux électroniques (EMR) sont extraites à l’aide d’Azure Data Factory avec le runtime approprié (par exemple: Azure, auto-hébergé). Dans ce scénario, nous partons du principe que les données rendues anonymes sont accessibles pour l’extraction par lots à l’aide de l’un des connecteurs Azure Data Factory, tels qu’ODBC, Oracle, SQL. D’autres sources de données telles que les données FHIR peuvent nécessiter l’inclusion d’un service d’ingestion intermédiaire comme Azure Functions.

  2. Azure Data Factory les données transitent par Data Factory dans Azure Data Lake Storage (gen 2). Aucune donnée n’est stockée dans Azure Data Factory pendant ce processus, et les défaillances telles que les connexions supprimées peuvent être gérées/retentées pendant cette étape.

  3. Azure Machine Learning est utilisé pour appliquer des algorithmes/pipelines Machine Learning aux données ingérées à l’étape 2. Les algorithmes peuvent être appliqués sur une base événementielle, planifiée ou manuellement en fonction des exigences. Plus précisément, cela inclut :

    3.1 Effectuer l’apprentissage : les données ingérées sont utilisées pour entraîner un modèle Machine Learning à l’aide d’une combinaison d’algorithmes tels que la régression linéaire et l’arbre de décision dégradé optimisé. Ces algorithmes sont fournis via différentes infrastructures (par exemple, scikit-learn) généralement dans un pipeline et peuvent inclure des étapes de pipeline de pré/post-traitement. Par exemple, les facteurs de santé des patients tels que le type d’admission provenant des données EMR/EHR existantes prétraitées (par exemple, supprimer des lignes Null) peuvent être utilisés pour entraîner un modèle de régression comme la régression linéaire. Le modèle serait alors capable de prédire une nouvelle durée de séjour des patients.

    3.2 Valider : les performances du modèle sont comparées aux modèles/données de test existants, ainsi qu’à toutes les cibles de consommation en aval telles que les Interfaces de programmation d’applications (API).

    3.3 Déployer : le modèle est packagé à l’aide d’un conteneur à utiliser dans différents environnements cibles.

    3.4 Surveiller : les prédictions de modèle sont collectées et surveillées pour garantir que les performances ne se dégradent pas au fil du temps. Les alertes peuvent être envoyées pour déclencher une reformation manuelle ou automatisée/mise à jour du modèle en fonction des besoins à l’aide de ces données d’analyse. Notez que des services supplémentaires comme Azure Monitor peuvent être nécessaires, en fonction du type de données de surveillance extraites.

  4. Les flux de sortie Azure Machine Learning vers Azure Synapse Analytics. La sortie du modèle (durée de séjour prédite du patient) est combinée avec les données de patient existantes dans une couche évolutive, servante comme un pool SQL dédié pour la consommation en aval. Des analyses supplémentaires telles que la durée moyenne de séjour par hôpital peuvent être effectuées via Synapse Analytics à ce stade.

  5. Azure Synapse Analytics fournit des données à Power BI. Plus précisément, Power BI se connecte à la couche de service à l’étape (4) pour extraire les données et appliquer une modélisation sémantique supplémentaire nécessaire.

  6. Power BI est utilisé pour l’analyse par le manager des services de soins et le coordinateur des ressources hospitalière.

Components

  • Azure Data Factory (ADF) fournit un service d’intégration de données serverless et d’orchestration complètement managé capable d’intégrer visuellement des sources de données avec plus de 90 connecteurs intégrés et sans maintenance sans coût supplémentaire. Dans ce scénario, ADF est utilisé pour ingérer des données et orchestrer les flux de données.

  • Azure Data Lake (ADLS) fournit un lac de données évolutif et sécurisé pour l’analyse à haute performance. Dans ce scénario, ADLS est utilisé comme couche de stockage de données évolutive et économique.

  • Les services Azure Machine Learning (AML) accélèrent le cycle de vie du Machine Learning de prédiction LOS de bout en bout en :

    • Permettre aux scientifiques des données et aux développeurs d’offrir un large éventail d’expériences productives pour créer, entraîner et déployer des modèles Machine Learning et favoriser la collaboration d’équipe.
    • Accélération du temps de commercialisation avec MLOps leader du secteur : opérations d’apprentissage automatique ou DevOps pour l’apprentissage automatique.
    • Innovation sur une plateforme sécurisée et approuvée conçue pour l’apprentissage automatique responsable.

    Dans ce scénario, AML est le service utilisé pour produire le modèle utilisé pour prédire la durée de séjour des patients et pour gérer le cycle de vie du modèle de bout en bout.

  • Azure Synapse Analytics : un service d’analyse illimité qui réunit l’intégration de données, l’entrepôt de données d’entreprise et des fonctionnalités analytiques pour le Big Data. Dans ce scénario, Synapse est utilisé pour incorporer les prédictions de modèle dans le modèle de données existant et pour fournir une couche de service à grande vitesse pour la consommation en aval.

  • Power BI fournit des analyses en libre-service à l’échelle de l’entreprise, ce qui vous permet de :

    • Créez une culture reposant sur les données avec l’intelligence décisionnelle pour tous.
    • Sécurisez vos données avec des fonctionnalités de sécurité des données de pointe, notamment l’étiquetage de confidentialité, le chiffrement de bout en bout et la surveillance de l’accès en temps réel.

    Dans ce scénario, Power BI est utilisé pour créer des tableaux de bord des utilisateurs finaux et appliquer toute modélisation sémantique nécessaire dans ces tableaux de bord.

Autres solutions

  • Les services Spark tels que Azure Synapse Analytics Spark et Azure Databricks peuvent être utilisés comme alternative pour effectuer le Machine Learning, en fonction de l’échelle des données et de l’ensemble de compétences de l’équipe de science des données.
  • MLFlow peut être utilisé pour gérer le cycle de vie de bout en bout comme alternative à Azure Machine Learning en fonction de l’ensemble de compétences/de l’environnement client.
  • Les pipelines Azure Synapse Analytics peuvent être utilisés comme alternative à Azure Data Factory dans la plupart des cas, en fonction en grande partie de l’environnement client spécifique.

Détails du scénario

Pour les responsables d’un établissement de santé, la durée du séjour, à savoir le nombre de jours entre l’admission du patient et sa sortie, est importante. Toutefois, cette durée peut varier d’un établissement à l’autre et selon les pathologies et les spécialités, même au sein d’un même système de santé, ce qui complique le suivi du flux de patients et la planification en conséquence.

Cette solution active un modèle prédictif pour la durée de séjour en cas d’admission à l’hôpital. La durée de séjour est définie en nombre de jours, de la date d’admission initiale jusqu’à la date à laquelle le patient est libéré d’un hôpital donné. La durée de séjour peut varier de façon significative en fonction des installations, des conditions pathologiques et des spécialisations, y compris au sein d’un même système de santé.

Des études telles que « La durée du séjour des patients est-elle liée à la qualité des soins ? » ont montré qu’une durée de séjour plus longue ajustée au risque est corrélée avec une qualité de soins inférieure reçue. La prédiction avancée de la durée de séjour au moment de l’admission peut améliorer la qualité des soins des patients, en renseignant les prestataires de la durée de séjour attendue qu’ils peuvent utiliser comme métrique pour comparer la durée du séjour des patients actuels. Cela peut aider à s’assurer que les patients dont la durée de séjour est plus longue que prévue reçoivent une attention appropriée. La prédiction de la durée de séjour aide également à planifier avec précision les décharges, ce qui réduit diverses autres mesures de qualité telles que les réadmissions.

Cas d’usage potentiels

Deux utilisateurs du système de gestion hospitalière peuvent s’attendre à bénéficier de prédictions plus fiables de la durée du séjour, ainsi que les familles des patients :

  • L’agent principal des renseignements médicaux qui fait le lien entre les services informatiques/technologiques et les professionnels de santé d’un établissement de santé. Son travail implique généralement l’utilisation d’analytiques pour déterminer si les ressources sont allouées de façon appropriée au sein d’un réseau hospitalier. L’agent principal des renseignements médicaux doit être en mesure de déterminer les installations qui sont surtaxées et, en particulier, les ressources de ces installations qui peuvent nécessiter un renforcement afin de les réaligner avec la demande.
  • Le manager de ligne de soins est directement impliqué dans les soins prodigués aux patients. Ce rôle nécessite de surveiller l’état de santé de chaque patient, et de s’assurer que le personnel est disponible pour répondre aux exigences spécifiques des patients. Le manager des services de soins peut prendre des décisions médicales précises et aligner les ressources appropriées à l’avance. Par exemple, la possibilité de prédire la durée de séjour :
    • comme évaluation initiale du risque des patients est essentielle pour une meilleure planification et répartition des ressources, en particulier lorsque les ressources sont limitées, comme dans les ICU.
    • permet aux managers de ligne de soins de déterminer si les ressources en personnel sont suffisantes pour gérer la sortie d’un patient.
  • Prédire la durée de séjour dans l’ICU est également bénéfique pour les patients et leurs familles, ainsi que pour les compagnies d’assurance. Une date prévue pour la sortie de l’hôpital aide les patients et leurs familles à comprendre et à estimer les coûts médicaux. Cela donne également aux familles une idée de la vitesse de récupération d’un patient et les aide à planifier la sortie et à gérer leurs budgets.

Considérations

Ces considérations implémentent les piliers d’Azure Well-Architected Framework qui est un ensemble de principes directeurs qui permettent d’améliorer la qualité d’une charge de travail. Pour plus d’informations, consultez Microsoft Azure Well-Architected Framework.

Optimisation des coûts

L’optimisation des coûts consiste à examiner les moyens de réduire les dépenses inutiles et d’améliorer l’efficacité opérationnelle. Pour plus d’informations, consultez Vue d’ensemble du pilier d’optimisation des coûts.

Le composant le plus coûteux de cette solution est le calcul et il existe plusieurs façons de mettre à l’échelle le calcul rentable avec le volume de données. Par exemple, vous pouvez utiliser un service Spark comme Azure Synapse Analytics Spark ou Azure Databricks pour le travail d’ingénierie des données, par opposition à une solution à nœud unique. Spark s’adapte horizontalement et est plus rentable par rapport aux solutions à nœud unique à grande échelle verticalement.

La tarification de tous les composants Azure, tel qu’il est configuré dans cette architecture, se trouve dans cette estimation enregistrée de la calculatrice de prix Azure. Cette estimation est configurée pour afficher les coûts initiaux et mensuels estimés, pour une implémentation de base qui s’exécute de 9 h à 17 h du lundi au vendredi.

Excellence opérationnelle

L’excellence opérationnelle couvre les processus d’exploitation qui déploient une application et maintiennent son fonctionnement en production. Pour plus d’informations, consultez Vue d’ensemble du pilier Excellence opérationnelle.

Une pratique et une implémentation solides de Machine Learning (MLOps) jouent un rôle essentiel dans la production de ce type de solution. Pour plus d’informations, consultez Opérations d’apprentissage automatique (MLOps).

Efficacité des performances

L’efficacité des performances est la capacité de votre charge de travail à s’adapter à la demande des utilisateurs de façon efficace. Pour plus d’informations, consultez Vue d’ensemble du pilier d’efficacité des performances.

Dans ce scénario, le prétraitement des données est effectué dans Azure Machine Learning. Bien que cette conception fonctionne pour les volumes de données de petite à moyenne taille, de grands volumes de données ou de scénarios avec des contrats SLA en temps quasi réel peuvent être difficiles du point de vue des performances. Une façon de répondre à ce type de préoccupation consiste à utiliser un service Spark comme Azure Synapse Analytics Spark ou Azure Databricks pour l’engineering données ou les charges de travail de science des données. Spark se met à l’échelle horizontalement et est distribué par conception, ce qui lui permet de traiter des jeux de données volumineux très efficacement.

Sécurité

La sécurité fournit des garanties contre les attaques délibérées, et contre l’utilisation abusive de vos données et systèmes importants. Pour plus d’informations, consultez Vue d’ensemble du pilier Sécurité.

Important

Cette architecture fonctionnera avec des données d’intégrité anonymes et non anonymes. Toutefois, pour une implémentation sécurisée, nous vous recommandons de créer des données d’intégrité sous une forme anonymisée à partir de sources EHR et EMR.

Pour plus d’informations sur les fonctionnalités de sécurité et de gouvernance disponibles pour Azure Machine Learning, consultez Sécurité et gouvernance d’entreprise pour Azure Machine Learning

Contributeurs

Cet article est géré par Microsoft. Il a été écrit à l’origine par les contributeurs suivants.

Auteurs principaux :

  • Dhanshri More | Architecte principal de solution cloud
  • DJ Dean | Architecte principal de solution cloud

Pour afficher les profils LinkedIn non publics, connectez-vous à LinkedIn.

Étapes suivantes

Technologies et ressources liées à l’implémentation de cette architecture :

Consultez le contenu supplémentaire du Centre d’architecture Azure lié à cette architecture :