Administración de la salud poblacional para el sector sanitario

Azure Data Factory
Azure Databricks
Azure
Power BI
Azure Machine Learning

Ideas de solución

Este artículo es una idea de solución. Si te gustaría que ampliemos este artículo con más información, como posibles casos de uso, servicios alternativos, consideraciones de implementación o una guía de precios, comunícalo a través de los Comentarios de GitHub.

En esta solución, usaremos los datos clínicos y socioeconómicos de los pacientes ingresados que generan los hospitales para realizar informes de la salud de la población.

Architecture

Architecture diagram shows how data is ingested, stored, processed through machine learning and published.

Descargue un archivo Visio de esta arquitectura.

Flujo de datos

  1. Los dispositivos de generación de datos en tiempo real (IoMT) transfieren datos a un receptor de ingesta de datos de streaming con autenticación de dispositivos, como Azure IoT Hub. Este receptor podría ser una instancia independiente de Azure IoT Hub o podría estar incluido en una plataforma de aplicaciones totalmente administrada, como Azure IOT Central, con aceleradores de soluciones, como una plantilla de supervisión continua de pacientes.

  2. Después, los datos del dispositivo se reciben en el Conector de FHIR de IoMT para Azure, donde se normalizan, agrupan, transforman y conservan en laAzure API for FHIR.

  3. Los orígenes de datos, como los sistemas de historias clínicas electrónicas, los sistemas de administración de pacientes o los sistemas de laboratorio, pueden generar otros formatos de mensaje, como los mensajes HL7, que se convierten a través de un flujo de trabajo de ingesta y conversión HL7. La plataforma de ingesta HL7 consume mensajes HL7 a través de MLLP y los transfiere de manera segura a Azure a través de HL7overHTTPS. Los datos aterrizan en el almacenamiento de blobs, lo que genera un evento en Azure Service Bus para su procesamiento. La conversión HL7 es un flujo de trabajo basado en la aplicación lógica de Azure que realiza la conversión de HL7 a FHIR de forma ordenada a través del convertidor de FHIR, conserva el mensaje en una instancia del servidor Azure API for FHIR

  4. Los datos se exportan desde el servicio Azure FHIR a Azure Data Lake Gen2 mediante la característica de exportación masiva. Los datos confidenciales se pueden anonimizar como parte de la función de exportación.

  5. Los trabajos de Azure Data Factory están programados para copiar otros orígenes de datos desde orígenes locales o alternativos a Azure Data Lake Gen2.

  6. Use Azure Databricks para limpiar y transformar los conjuntos de datos sin estructura y combinarlos con datos estructurados de bases de datos operativas o de almacenamientos de datos. Use técnicas escalables de aprendizaje automático o aprendizaje profundo para obtener información más detallada de estos datos mediante Python, R o Scala, con experiencias de Notebook integradas en Azure Databricks. En esta solución, usamos Databricks para reunir conjuntos de datos relacionados, pero dispares, para usarlos en el modelo de duración de la estancia de los pacientes.

  7. La experimentación y el desarrollo de modelos tienen lugar en Azure Databricks. La integración en Azure ML a través de MLflow permite una experimentación rápida del modelo con el seguimiento, el repositorio de modelos y la implementación.

  8. Publique los modelos entrenados mediante Azure Machine Learning Service para la puntuación por lotes a través de puntos de conexión de Azure Databricks o como un punto de conexión en tiempo real mediante una instancia de Azure Container Instance o Azure Kubernetes Service.

Componentes

  • Azure IoT Connector for FHIR es una característica opcional de Azure API for FHIR que proporciona la funcionalidad de ingesta de datos de dispositivos de Internet de las cosas médicas (IoMT). Como alternativa para cualquier persona que quiera tener más control y flexibilidad con el conector de IoT, IoMT FHIR Connector for Azure es un proyecto de código abierto para ingerir datos de dispositivos IoMT y conservar los datos en un servidor FHIR®.

  • Azure Data Factory es un servicio híbrido de integración de datos que le permite crear, programar y orquestar flujos de trabajo ETL y ELT.

  • Azure API for FHIR es un servicio de nivel empresarial totalmente administrado para datos de salud en formato FHIR.

  • Azure Data Lake Storage es una funcionalidad de lago de datos segura y muy escalable, creada sobre Azure Blob Storage.

  • Azure Databricks es una plataforma de análisis de datos rápida, sencilla y colaborativa basada en Apache Spark.

  • Azure Machine Learning es un servicio en la nube que se usa para entrenar, puntuar, implementar y administrar modelos de aprendizaje automático a gran escala. Esta arquitectura usa la compatibilidad nativa de Azure Machine Learning Service con MLflow para registrar experimentos, almacenar modelos e implementar modelos.

  • Power BI es un conjunto de herramientas de análisis empresarial que proporciona información detallada acerca de toda la organización. Conéctese a cientos de orígenes de datos, simplifique la preparación de los datos y realice análisis interactivos. Cree informes atractivos y publíquelos en la organización para que se usen en la web y en los dispositivos móviles.

Detalles del escenario

Population Health Management constituye una herramienta importante que los proveedores de asistencia sanitaria usan cada vez más para administrar y controlar los costos de escalado. El punto decisivo de Population Health Management es el uso de los datos para mejorar los resultados relacionados con la salud. El seguimiento, la supervisión y las pruebas comparativas son los tres bastiones de Population Health Management, cuyo objetivo es mejorar los resultados clínicos y de salud a la vez que se administra y reduce el costo.

Como ejemplo de aplicación de aprendizaje automático con administración de la salud poblacional, se usa un modelo para predecir la duración de la estancia en el hospital. Está adaptado para que los hospitales y profesionales de la salud administren y controlen el gasto sanitario mediante la administración y prevención de enfermedades. Puede obtener información sobre los datos usados y el modelo de duración de la estancia en el hospital en la guía de implementación manual de la solución. Los hospitales pueden utilizar estos resultados para optimizar los sistemas de administración de la asistencia sanitaria y centrar sus recursos clínicos en los pacientes con necesidades más urgentes. El conocimiento de las comunidades a las que prestan servicio a través de los informes de la salud de la población puede ayudar a los hospitales a pasar de los pagos de un honorario por servicio a la atención basada en valor y, al mismo tiempo, reducir los costos y proporcionar una mejor atención.

Posibles casos de uso

Esta solución es idónea para el sector sanitario. Se puede usar para los escenarios siguientes:

  • Supervisión en el pacientes
  • Ensayos clínicos
  • Consultorios inteligentes

Implementación de este escenario

Aquí se detallan dos proyectos de ejemplo que se pueden importar en Azure Databricks. El modo de clúster estándar debe usarse en los cuadernos de predicción de la duración de la estancia debido al uso de código de R. Puede implementar la solución en los ejemplos siguientes:

  1. El informe de salud de la población activa con predicciones de duración de la estancia entrena un modelo mediante registros de nivel de encuentro para un millón de pacientes aproximadamente. El esquema de los datos coincide con los datos de las bases de datos de estancias de pacientes hospitalizados (SID) del Healthcare Cost and Utilization Project (HCUP) para facilitar el uso de la solución con datos reales de HCUP. Es adecuado para usarlo en poblaciones de pacientes similares, aunque para obtener mejores resultados se recomienda que los hospitales vuelvan a entrenar el modelo con los datos históricos de sus propios pacientes. La solución simula 610 características clínicas y demográficas, como la edad, el género, el código postal, los diagnósticos, los procedimientos, los cargos, etc., para aproximadamente un millón de pacientes en 23 hospitales. Para aplicarse a los pacientes recién admitidos, el modelo debe entrenarse solo con características disponibles para cada paciente en el momento de su admisión.

  2. La predicción de readmisiones e intervenciones específicas de un paciente para asistencia sanitaria usa un conjunto de datos de diabetes que se produjo originalmente para el Simposio de primavera de 1994 de AAAI sobre Inteligencia artificial en Medicina, ahora compartido de manera generosa por el Dr. Michael Kahn en el repositorio de aprendizaje automático de UCI.

Colaboradores

Microsoft mantiene este artículo. Originalmente lo escribieron los siguientes colaboradores.

Autor principal:

Pasos siguientes

Documentación del producto: