你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

面向医疗保健的人口健康管理

Azure 数据工厂
Azure Databricks
Azure
Power BI
Azure 机器学习

解决方案构想

本文是一种解决方案构想。 如果你希望我们在内容中扩充更多信息,例如潜在用例、备用服务、实现注意事项或定价指南,请通过提供 GitHub 反馈来告知我们。

在此解决方案中,我们将使用医院提供的住院患者临床和社会经济数据进行人口健康报告。

体系结构

Architecture diagram shows how data is ingested, stored, processed through machine learning and published.

下载此体系结构的 Visio 文件

数据流

  1. 实时数据生成设备 (IoMT) 将数据传输到需要设备身份验证的流数据引入接收器,例如 Azure IoT 中心。 此接收器可以是独立的 Azure IoT 中心,也可以包含在完全托管的应用程序平台中,例如 Azure IOT Central,其中包含如持续患者监视模板等解决方案加速器。

  2. 然后,设备数据将被纳入适用于 Azure 的 IoMT FHIR 连接器中,该连接器已规范化、分组、转换并保存到 Azure API for FHIR 中。

  3. 电子病例系统、患者管理系统或实验室系统等数据源可能会生成其他消息格式,例如通过 HL7 引入和转换工作流转换的 HL7 消息。 HL7 引入平台通过 MLLP 使用 HL7 消息,并通过 HL7overHTTPS 安全地将其传输到 Azure。 数据位于 Blob 存储中,该存储在 Azure 服务总线上生成事件进行处理。 HL7 转换是基于 Azure 逻辑应用的工作流,通过 FHIR 转换器从 HL7 到 FHIR 有序执行转换,将消息保存到 Azure API for FHIR 服务器实例中

  4. 使用批量导出功能将数据从 Azure FHIR 服务导出到 Azure Data Lake Gen2。 使用导出功能时,还可以将敏感数据匿名化

  5. Azure 数据工厂作业按计划将其他数据源从本地或备用源复制到 Azure Data Lake Gen 2。

  6. 使用 Azure Databricks 清理和转换无结构数据集,并将其与来自操作数据库或数据仓库的结构化数据相结合。 使用可缩放的机器学习/深度学习技术,通过利用 Python、R 或 Scala 并结合 Azure Databricks 中的内置笔记本体验,从这些数据中获得更深入的见解。 在此解决方案中,我们使用 Databricks 汇集相关但不同的数据集,用于患者住院时间模型。

  7. 试验和模型开发在 Azure Databricks 中进行。 通过 MLflow 与 Azure ML集成,可以通过跟踪、模型存储库和部署快速进行模型试验。

  8. 使用 Azure 机器学习服务发布经过训练的模型,以通过 Azure Databricks 终结点进行批处理评分,或作为实时终结点使用 Azure 容器实例Azure Kubernetes 服务

组件

  • 适用于 FHIR 的 Azure IoT 连接器是 Azure API for FHIR 的一项可选功能,使你能够引入来自医疗物联网 (IoMT) 设备的数据。 或者,对于任何希望通过 IoT 连接器获得更多控制和灵活性的用户,适用于 Azure 的 IoMT FHIR 连接器是一个开源项目,用于从 IoMT 设备引入数据,并将数据保存在 FHIR® 服务器中。

  • Azure 数据工厂是一种混合数据集成服务,通过它可创建、调度和协调 ETL/ELT 工作流。

  • Azure API for FHIR 是一种完全托管的企业级服务,用于采用 FHIR 格式的健康状况数据。

  • Azure Data Lake Storage 是基于 Azure Blob 存储构建的可大规模缩放的安全数据湖功能。

  • Azure Databricks 是基于 Apache Spark 的快速简单的协作数据分析平台。

  • Azure 机器学习是用于大规模训练、评分、部署和管理机器学习模型的云服务。 此体系结构使用 Azure 机器学习服务对 MLflow 的本机支持来记录试验、存储模型和部署模型。

  • Power BI 是一套业务分析工具,用于在整个组织内提供见解。 连接数百个数据源、简化数据准备工作、加快交互式分析。 生成美观的报表,然后发布它们,供组织在 Web 和移动设备上使用。

方案详细信息

人口健康管理是一项重要的工具,医保提供商越来越多地使用此工具来管理和控制增加的成本。 人口健康管理的关键是使用数据来改善保健结果。 跟踪、监视和基准标记是人口健康管理的三大功能,旨在改进临床和健康结果,同时管理和降低成本。

作为使用人口健康管理工具的机器学习应用程序示例,模型用于预测住院时长。 它主要面向医院和医疗保健提供商,通过疾病预防和管理来管理和控制医疗保健支出。 可以在解决方案的手动部署指南中了解使用的数据和住院时间模型。 医院可以使用这些结果来优化护理管理系统,并将其临床资源集中在有更迫切需求的患者身上。 通过人口健康报告了解医院所服务的社区,可以帮助医院从根据服务收费转型到基于重视关怀护理价值,同时降低成本并提供更好的护理。

可能的用例

此解决方案非常适合医疗保健行业。 它可用于以下方案:

  • 患者监视
  • 临床试验
  • 智能诊所

部署此方案

此处详细介绍了两个可以导入 Azure Databricks 的示例项目。 由于使用了 R 代码,因此必须在“预测住院时间”笔记本上使用标准群集模式。 可以通过以下示例部署解决方案:

  1. 具有住院时间预测的实时人口健康报告使用约一百万患者级别的记录来训练模型。 数据架构与医疗成本和利用项目 (HCUP) 中国家住院患者数据库 (SID) 数据相匹配,以促进解决方案与真实 HCUP 数据的使用。 它适用于类似的患者群体,但建议医院使用自己的历史患者数据重新训练模型,以获得最佳结果。 该解决方案模拟了 23 家医院约 100 万名患者的 610 个临床和人口统计特征,包括年龄、性别、邮政编码、诊断、程序、收费等。 若要应用于新入院患者,则模型必须仅使用每位患者入院时均适用的特征进行训练。

  2. 针对特定患者的再次入院预测和医疗保健干预使用最初为 1994 年 AAI 医学人工智能春季研讨会制作的糖尿病数据集,目前 Michael Kahn 博士在 UCI 机器学习存储库中慷慨共享了此数据集。

作者

本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。

主要作者:

后续步骤

产品文档: