Прогнозирование продолжительности пребывания и потока пациентов

Фабрика данных Azure
Azure Data Lake Storage
Машинное обучение Azure
Azure Synapse Analytics
Power BI

Это решение Azure помогает администраторам больниц использовать возможности машинного обучения для прогнозирования продолжительности пребывания в стационаре для улучшения планирования ресурсов и использования ресурсов. Главный сотрудник по медицинской информации может использовать прогнозную модель, чтобы определить, какие объекты перегружены и какие ресурсы следует укрепить в этих учреждениях. Руководитель линии ухода может использовать модель для определения наличия достаточных кадровых ресурсов для обработки освобождения пациента.

Архитектура

Схема архитектуры удаленного мониторинга пациентов с использованием медицинских устройств и служб Azure.

Скачайте файл Visio этой архитектуры.

Поток данных

Следующий поток данных соответствует приведенной выше схеме:

  1. Анонимные медицинские данные из электронных медицинских карт (EHR) и электронных медицинских записей (EMR) извлекаются с помощью Фабрика данных Azure с соответствующей средой выполнения (например, Azure, локальная). В этом сценарии предполагается, что анонимные данные доступны для пакетного извлечения с помощью одного из соединителей Фабрика данных Azure, таких как ODBC, Oracle, SQL. Другие источники данных, такие как данные FHIR, могут потребовать включения промежуточной службы приема, такой как Функции Azure.

  2. Фабрика данных Azure данные передаются через Фабрику данных в Azure Data Lake Storage (поколение 2). Данные не хранятся в Фабрика данных Azure во время этого процесса, и на этом шаге можно обработать или повторить сбои, такие как удаленные подключения.

  3. Машинное обучение Azure используется для применения алгоритмов или конвейеров машинного обучения к данным, полученные на шаге 2. Алгоритмы могут применяться на основе событий, по расписанию или вручную в зависимости от требований. В частности, это включает в себя:

    3.1 Обучение — используемые данные используются для обучения модели машинного обучения с помощью сочетания таких алгоритмов, как линейная регрессия и дерево принятия решений с повышением градиента. Эти алгоритмы предоставляются через различные платформы (например, scikit-learn), как правило, в конвейере и могут включать этапы конвейера до и после обработки. Например, для обучения модели регрессии, такой как линейная регрессия, можно использовать такие факторы здоровья пациентов, как входной тип, поступающие из существующих предварительно обработанных (например, удаление пустых строк) данных EMR/EHR. Затем модель сможет предсказать новый срок пребывания пациента.

    3.2 Проверка — производительность модели сравнивается с существующими моделями или тестируемыми данными, а также с любыми нижестоящими целевыми показателями потребления, такими как программные интерфейсы (API).

    3.3 Развертывание — модель упакована с помощью контейнера для использования в разных целевых средах.

    3.4 Монитор — прогнозы модели собираются и отслеживаются, чтобы гарантировать, что производительность не снижается с течением времени. Оповещения можно отправлять для активации ручного или автоматического переобучения или обновления модели при необходимости с помощью этих данных мониторинга. Обратите внимание, что в зависимости от типа извлекаемых данных мониторинга могут потребоваться дополнительные службы, такие как Azure Monitor.

  4. Потоки выходных данных Машинного обучения Azure в Azure Synapse Analytics. Выходные данные модели (прогнозируемый срок пребывания пациента) объединяются с существующими данными о пациентах в масштабируемом, обслуживаемом уровне, например выделенном пуле SQL для последующего использования. На этом этапе с помощью Synapse Analytics можно выполнить дополнительную аналитику, например среднюю продолжительность пребывания в больнице.

  5. Azure Synapse Analytics предоставляет данные в Power BI. В частности, Power BI подключается к уровню обслуживания на шаге (4) для извлечения данных и применения дополнительного необходимого семантического моделирования.

  6. Power BI используется для анализа менеджером линии ухода и координатором ресурсов больницы.

Компоненты

  • Фабрика данных Azure (ADF) предоставляет полностью управляемую бессерверную службу интеграции данных и оркестрации, которая позволяет визуально интегрировать источники данных с более чем 90 встроенными соединителями без обслуживания без дополнительных затрат. В этом сценарии ADF используется для приема данных и оркестрации потоков данных.

  • Azure Data Lake (ADLS) предоставляет масштабируемое безопасное озеро данных для высокопроизводительной аналитики. В этом сценарии ADLS используется в качестве масштабируемого и экономичного уровня хранения данных.

  • Службы машинного обучения Azure (AML) ускоряют комплексный жизненный цикл машинного обучения прогнозирования ЛОС за счет:

    • Предоставление специалистам по обработке и анализу данных и разработчикам широкий спектр продуктивных возможностей для создания, обучения и развертывания моделей машинного обучения и содействия совместной работе команды.
    • Ускорение вывода на рынок с помощью ведущих в отрасли MLOps — операций машинного обучения или DevOps для машинного обучения.
    • Инновации на безопасной и надежной платформе, предназначенной для ответственного машинного обучения.

    В этом сценарии AML — это служба, используемая для создания модели, используемой для прогнозирования продолжительности пребывания пациента, а также для управления комплексным жизненным циклом модели.

  • Azure Synapse Analytics— служба безграничной аналитики, которая объединяет интеграцию данных, хранение корпоративных данных и аналитику больших данных. В этом сценарии Synapse используется для включения прогнозов модели в существующую модель данных, а также для предоставления высокоскоростного уровня обслуживания для нисходящего потребления.

  • Power BI предоставляет аналитику самообслуживания в масштабе предприятия, что позволяет:

    • Создайте управляемую данными культуру с бизнес-аналитикой для всех.
    • Обеспечьте безопасность данных с помощью ведущих в отрасли возможностей защиты данных, включая маркировку конфиденциальности, сквозное шифрование и мониторинг доступа в режиме реального времени.

    В этом сценарии Power BI используется для создания пользовательских панелей мониторинга и применения семантического моделирования, необходимого для этих панелей мониторинга.

Альтернативные варианты

  • Службы Spark, такие как Azure Synapse Analytics Spark и Azure Databricks, можно использовать в качестве альтернативы для машинного обучения в зависимости от масштаба данных и набора навыков команды по обработке и анализу данных.
  • MLFlow можно использовать для комплексного управления жизненным циклом в качестве альтернативы Машинному обучению Azure в зависимости от набора навыков и среды клиента.
  • Конвейеры Azure Synapse Analytics в большинстве случаев можно использовать в качестве альтернативы Фабрика данных Azure в зависимости от конкретной среды клиента.

Сведения о сценарии

Для людей, работающих в медицинском учреждении, имеет значение продолжительность пребывания (ЛОС) — количество дней от приема пациента до выписки. Тем не менее, это число может варьироваться в разных учреждениях и в зависимости от условий заболевания и специальностей, даже в рамках одной системы здравоохранения, что затрудняет отслеживание потока пациентов и планирование соответствующим образом.

Это решение позволяет использовать прогнозную модель для лос-анджелеса для госпитализации. ЛОС определяется в количестве дней с даты первоначального приема до даты выписки пациента из любого больничного учреждения. Могут быть значительные различия ЛОС в различных учреждениях, заболеваниях и специальностях, даже в рамках одной и той же системы здравоохранения.

Исследования, такие как Является ли продолжительность пребывания пациента связаны с качеством медицинской помощи? показали, что более длительный риск скорректированных ЛОС коррелирует с более низким качеством получаемой медицинской помощи. Расширенный прогноз LOS на момент поступления может повысить качество лечения пациента, предоставляя поставщикам ожидаемые ЛОС, которые они могут использовать в качестве метрики для сравнения с текущим пациентом ЛОС. Это может помочь обеспечить, чтобы пациенты с более длительным, чем ожидалось ЛОС, получали соответствующее внимание. Прогнозирование ЛОС также помогает с точным планированием разрядов, что приводит к снижению различных других показателей качества, таких как редмиссии.

Потенциальные варианты использования

Есть два разных бизнес-пользователя в управлении больницами, которые могут рассчитывать на преимущества более надежных прогнозов продолжительности пребывания, а также семьи пациентов:

  • Главный специалист по медицинской информации (CMIO), который разделяет разрыв между информатикой/технологиями и медицинскими работниками в организации здравоохранения. Их обязанности обычно включают использование аналитики для определения того, распределяются ли ресурсы надлежащим образом в сети больницы. CMIO должна иметь возможность определить, какие объекты переначисляются, и в частности, какие ресурсы на этих объектах, возможно, потребуется укрепить для перераспределения таких ресурсов с учетом спроса.
  • Менеджер линии ухода, который непосредственно участвует в уходе за пациентами. Эта роль требует мониторинга состояния отдельных пациентов и обеспечения доступности персонала для удовлетворения конкретных требований к уходу своих пациентов. Менеджер линии ухода может принимать точные медицинские решения и заранее согласовывать правильные ресурсы. Например, возможность прогнозирования LOS:
    • так как первоначальная оценка риска пациентов имеет решающее значение для лучшего планирования и распределения ресурсов, особенно при ограниченности ресурсов, как в ICU.
    • позволяет руководителям линии ухода определить, будут ли кадровые ресурсы достаточными для решения дела об освобождении пациента.
  • Прогнозирование ЛОС в реанимации также полезно для пациентов и их семей, а также страховых компаний. Ожидаемая дата выписки из больницы помогает пациентам и их семьям понять и оценить медицинские расходы. Это также дает семьям представление о скорости восстановления пациента, и помогает им планировать выписку и управлять своим бюджетом.

Рекомендации

Эти рекомендации реализуют основные принципы Azure Well-Architected Framework, которая представляет собой набор руководящих принципов, которые можно использовать для повышения качества рабочей нагрузки. Дополнительные сведения см. в статье Microsoft Azure Well-Architected Framework.

Оптимизация затрат

Оптимизация затрат заключается в поиске способов уменьшения ненужных расходов и повышения эффективности работы. Дополнительные сведения см. в разделе Обзор критерия "Оптимизация затрат".

Самым ресурсоемким компонентом этого решения являются вычисления, и существует несколько способов экономичного масштабирования вычислений с помощью объема данных. Одним из примеров может быть использование службы Spark, такой как Azure Synapse Analytics Spark или Azure Databricks, для инжиниринга данных, в отличие от решения с одним узлом. Spark масштабируется горизонтально и является более экономичным по сравнению с крупными вертикально масштабируемыми решениями с одним узлом.

Цены на все компоненты Azure, настроенные в этой архитектуре, можно найти в этой сохраненной оценке калькулятора цен Azure. Эта оценка настроена для отображения предполагаемых предварительных и ежемесячных затрат для базовой реализации, которая выполняется с 9:00 до 17:00 с понедельника по пятницу.

эффективность работы;

Эффективность работы охватывает операционные процессы, которые развертывают приложение и сохраняют его работу в рабочей среде. Дополнительные сведения см. в статье Общие сведения о принципе эффективности операций.

Надежная практика и реализация операций машинного обучения (MLOps) играет важную роль в производстве этого типа решения. Дополнительные сведения см. в разделе Операции машинного обучения (MLOps).

Уровень производительности

Уровень производительности — это способность вашей рабочей нагрузки масштабироваться в соответствии с требованиями, предъявляемыми к ней пользователями эффективным образом. Дополнительные сведения см. в статье Общие сведения о принципах эффективности производительности.

В этом сценарии предварительная обработка данных выполняется в Машинном обучении Azure. Хотя эта конструкция будет работать для небольших и средних объемов данных, большие объемы данных или сценарии с соглашениями об уровне обслуживания почти в реальном времени могут испытывать трудности с точки зрения производительности. Одним из способов решения этой проблемы является использование службы Spark, такой как Azure Synapse Analytics Spark или Azure Databricks, для рабочих нагрузок инжиниринга данных или обработки и анализа данных. Spark масштабируется горизонтально и распределяется по умолчанию, что позволяет очень эффективно обрабатывать большие наборы данных.

Безопасность

Безопасность обеспечивает гарантии от преднамеренных атак и злоупотреблений ценными данными и системами. Дополнительные сведения см. в статье Общие сведения о компонентах безопасности.

Важно!

Эта архитектура будет работать как с анонимными, так и с неанонимизированными данными о работоспособности. Однако для безопасной реализации мы рекомендуем получать данные о работоспособности в анонимной форме из источников EHR и EMR.

Дополнительные сведения о функциях безопасности и управления, доступных для Машинного обучения Azure, см. в статье Корпоративная безопасность и управление для Машинного обучения Azure.

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально она была написана следующими участниками.

Основные авторы:

Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.

Дальнейшие действия

Технологии и ресурсы, связанные с реализацией этой архитектуры:

См. дополнительные материалы Центра архитектуры Azure, связанные с этой архитектурой: