Gestion des données médicales de la population dans le secteur de la santé

Azure Data Factory
Azure Databricks
Azure
Power BI
Azure Machine Learning

Idées de solution

Cet article présente une idée de solution. Si vous souhaitez que nous développions le contenu avec d’autres informations, telles que des cas d’usage potentiels, d’autres services, des considérations d’implémentation ou un guide des prix, adressez-nous vos commentaires GitHub.

Dans cette solution, nous allons utiliser les données cliniques et socio-économiques des patients générées par les hôpitaux pour la création de rapports sur la santé de la population.

Architecture

Architecture diagram shows how data is ingested, stored, processed through machine learning and published.

Téléchargez un fichier Visio de cette architecture.

Dataflow

  1. Les appareils générant des données en temps réel (IoMT) transfèrent celles-ci vers un récepteur d'ingestion de données en continu avec une méthode d'authentification de l'appareil, comme Azure IoT Hub. Ce récepteur peut être une instance autonome d'Azure IoT Hub ou il peut être inclus dans une plateforme d'applications complètement managée, comme Azure IOT Central, avec des accélérateurs de solution tels qu'un modèle de surveillance continue des patients.

  2. Les données de l'appareil sont ensuite reçues dans le connecteur IoMT FHIR pour Azure, où elles sont normalisées, regroupées et transformées avant d'être conservées dans l'API Azure pour FHIR.

  3. Les sources de données telles que les systèmes de dossiers médicaux électroniques, les systèmes d'administration des patients ou les systèmes des laboratoires peuvent générer d'autres formats de messages comme des messages HL7 qui sont convertis via un workflow d'acquisition et de conversion HL7. La plateforme d'ingestion HL7 consomme les messages HL7 par le biais de MLLP et les transfère en toute sécurité vers Azure via HL7overHTTPS. Les données arrivent dans le stockage d'objets blob, qui produit un événement sur Azure Service Bus à des fins de traitement. La conversion HL7 est un workflow basé sur une application logique Azure qui procède à une conversion ordonnée de HL7 vers FHIR via le convertisseur FHIR, et conserve le message dans une instance de serveur API Azure pour FHIR

  4. Les données sont exportées du service Azure FHIR vers Azure Data Lake Gen 2 à l'aide de la fonctionnalité d'exportation en bloc. Les données sensibles peuvent être rendues anonymes dans le cadre de la fonction d'exportation.

  5. Des travaux Azure Data Factory sont planifiés pour copier d'autres sources de données vers Azure Data Lake Gen 2 à partir de sources locales ou alternatives.

  6. Utilisez Azure Databricks pour nettoyer et transformer les jeux de données sans structure, et les combiner avec des données structurées issues de bases de données opérationnelles ou d’entrepôts de données. Utilisez des techniques de Machine Learning/Deep Learning évolutives pour obtenir des insights plus détaillés à partir de ces données à l'aide de Python, R ou Scala, avec des expériences de notebook intégrées dans Azure Databricks. Dans cette solution, nous utilisons Databricks pour rassembler des jeux de données connexes, mais disparates, afin de les utiliser dans le modèle de durée de séjour des patients.

  7. L'expérimentation et le développement des modèles se font dans Azure Databricks. L’intégration à Azure Machine Learning par le biais de MLflow permet une expérimentation rapide des modèles avec suivi, référentiel de modèles et déploiement.

  8. Publiez des modèles formés à l'aide du service Azure Machine Learning pour le scoring par lots via des points de terminaison Azure Databricks, ou en tant que point de terminaison en temps réel à l'aide d'Azure Container Instance ou d'Azure Kubernetes Service.

Components

  • Le connecteur Azure IoT pour FHIR est une fonctionnalité facultative du service API Azure pour FHIR qui permet d'ingérer des données à partir d'appareils de l'Internet des objets médicaux (IoMT, Internet of Medical Things). Si vous souhaitez bénéficier d'un contrôle et d'une flexibilité accrus avec le connecteur IoT, le connecteur IoMT FHIR pour Azure est un projet open source qui permet d'ingérer des données issus d'appareils IoMT et de les conserver dans un serveur FHIR®.

  • Azure Data Factory est un service d'intégration de données hybride qui vous permet de créer, de planifier et d'orchestrer vos workflows ETL/ELT.

  • API Azure pour FHIR est un service de classe entreprise complètement managé dédié aux données de santé au format FHIR.

  • Azure Data Lake Storage est une fonctionnalité de lac de données sécurisée et extrêmement évolutive qui repose sur le service Stockage Blob Azure.

  • Azure Databricks est une plateforme d'analyse de données rapide, simple et collaborative basée sur Apache Spark.

  • Azure Machine Learning est un service cloud pour l’entraînement, le scoring, le déploiement et la gestion des modèles Machine Learning à grande échelle. Cette architecture utilise la prise en charge native de MLflow par le service Azure Machine Learning pour consigner les expériences, stocker les modèles et les déployer.

  • Power BI est une suite d’outils d’analytique métier qui fournit des insights à l’échelle de votre organisation. Connectez-vous à des centaines de sources de données, simplifiez la préparation des données et facilitez les analyses interactives. Créez de superbes rapports, puis publiez-les pour que votre organisation les utilise sur le web et sur des appareils mobiles.

Détails du scénario

Gestion des données médicales de la population est un outil important qui est de plus en plus utilisé par les fournisseurs du secteur médical pour gérer et contrôler l’augmentation des coûts. L’objectif principal de Gestion des données médicales de la population consiste à utiliser des données pour améliorer les résultats médicaux. Le suivi, la supervision et le positionnement stratégique sont les trois bastions de Gestion des données médicales de la population, visant à améliorer les résultats cliniques et médicaux tout en gérant et en réduisant les coûts.

En guise d'exemple d'application d'apprentissage automatique intégrant la gestion de la santé de la population, un modèle est utilisé pour prédire la durée d'hospitalisation. Il est destiné à aider les hôpitaux et les prestataires de soins de santé à gérer et contrôler les dépenses de santé par la prévention et la gestion des maladies. Pour en savoir plus sur les données utilisées et le modèle de durée d’hospitalisation, consultez le guide de déploiement manuel de la solution. Les hôpitaux peuvent utiliser ces résultats pour optimiser les systèmes de gestion des soins et concentrer leurs ressources cliniques sur les patients ayant un besoin plus urgent. Comprendre les communautés qu’ils desservent grâce aux rapports sur la santé de la population peut aider les hôpitaux à passer du paiement à l’acte à des soins basés sur la valeur, tout en réduisant les coûts et en fournissant de meilleurs soins.

Cas d’usage potentiels

Cette solution est idéale pour le secteur de la santé. Elle peut être utilisée pour les scénarios suivants :

  • Surveillance des patients
  • Essais cliniques
  • Cliniques intelligentes

Déployer ce scénario

Deux exemples de projets sont détaillés ici et peuvent être importés dans Azure Databricks. Le mode Cluster standard doit être utilisé sur les notebooks Prédiction de durée de séjour en raison de l'utilisation du code R. Vous pouvez déployer la solution dans les exemples suivants :

  1. Le projet Live Population Health Report with Length of Stay predictions (Rapport en direct sur la santé de la population avec prévisions de durée de séjour) effectue l'apprentissage d'un modèle à l'aide des enregistrements d'un million de patients. Le schéma des données correspond aux données SID (State Inpatient Databases) du projet HCUP (Healthcare Cost and Utilization Project) afin de faciliter l'utilisation de la solution avec des données HCUP réelles. Il convient à une utilisation sur des populations de patients similaires, mais nous recommandons aux hôpitaux de renouveler l'apprentissage du modèle en utilisant leurs propres historiques de données patients pour obtenir de meilleurs résultats. La solution simule 610 caractéristiques cliniques et démographiques, notamment l'âge, le sexe, le code postal, les diagnostics, les procédures, les frais, etc. pour environ un million de patients répartis sur 23 hôpitaux. Pour être appliqué aux patients nouvellement admis, le modèle doit faire l'objet d'un apprentissage reposant uniquement sur les caractéristiques disponibles pour chaque patient au moment de son admission.

  2. Le projet Patient-specific Readmission Prediction and Intervention for Health Care (Prévision et intervention en matière de réadmission spécifique au patient pour les soins de santé) utilise un jeu de données sur le diabète initialement produit pour l'AAI Spring Symposium on Artificial Intelligence in Medicine de 1994, aujourd'hui généreusement partagé par le Dr Michael Kahn sur le référentiel UCI Machine Learning Repository.

Contributeurs

Cet article est géré par Microsoft. Il a été écrit à l’origine par les contributeurs suivants.

Auteur principal :

Étapes suivantes

Documentation du produit :