의료 분야에 대한 집단 건강 관리

Azure Data Factory
Azure Databricks
Azure
Power BI
Azure Machine Learning

솔루션 아이디어

이 문서는 솔루션 아이디어입니다. 잠재적인 사용 사례, 대체 서비스, 구현 고려 사항 또는 가격 책정 지침과 같은 추가 정보로 콘텐츠를 확장하려면 GitHub 피드백을 제공하여 알려주세요.

이 솔루션에서는 인구 건강 보고를 위해 병원에서 생성된 임상 및 사회 경제적 입원 환자 데이터를 사용합니다.

아키텍처

Architecture diagram shows how data is ingested, stored, processed through machine learning and published.

이 아키텍처의 Visio 파일을 다운로드합니다.

데이터 흐름

  1. IoMT(실시간 데이터 생성 디바이스)는 Azure IoT Hub처럼 디바이스 인증을 사용하는 스트리밍 데이터 수집 싱크로 데이터를 전송합니다. 이 싱크는 독립 실행형 Azure IoT Hub이거나 지속적인 환자 모니터링 템플릿과 같은 솔루션 가속기가 있는 Azure IOT Central과 같은 완전 관리형 애플리케이션 플랫폼에 포함될 수 있습니다.

  2. 그런 다음, 디바이스 데이터는 Azure용 IoMT FHIR 커넥터로 수신되며, 여기서 정규화, 그룹화, 변환을 거쳐 Azure API for FHIR에 보존됩니다.

  3. 전자 의료 기록 시스템, 환자 관리 시스템 또는 랩 시스템과 같은 데이터 원본은 HL7 수집 및 변환 워크플로를 통해 변환되는 HL7 메시지와 같은 다른 메시지 형식을 생성할 수 있습니다. HL7 수집 플랫폼은 MLLP를 통해 HL7 메시지를 사용하고 HL7overHTTPS를 통해 안전하게 Azure로 메시지를 전송합니다. 데이터가 Blob Storage에 도달하고, 처리를 위해 Azure Service Bus에 이벤트를 생성합니다. HL7 변환은 FHIR 변환기를 통해 HL7에서 FHIR로 순차적 변환을 수행하고, FHIR 서버 인스턴스용 Azure API에 메시지를 보존하는 Azure Logic App 기반 워크플로입니다.

  4. 대량으로 내보내기 기능을 사용하여 Azure FHIR 서비스에서 Azure Data Lake Gen2로 데이터를 내보냅니다. 내보내기 기능 사용 중에 중요한 데이터를 익명화할 수 있습니다.

  5. Azure Data Factory 작업은 다른 데이터 원본을 온-프레미스 또는 대체 원본에서 Azure Data Lake Gen 2로 복사하도록 예약됩니다.

  6. Azure Databricks를 사용하여 비정형 데이터 세트를 정리 및 변환하고 운영 데이터베이스 또는 데이터 웨어하우스의 구조화된 데이터와 결합합니다. 확장 가능한 기계 학습/딥 러닝 기술을 사용하면 Azure Databricks에 기본 제공되는 Notebook 환경을 통해 Python, R 또는 Scala를 사용하여 이 데이터에서 더 심층적인 인사이트를 얻을 수 있습니다. 이 솔루션에서는 Databricks를 사용하여 관련이 있지만 이질적인 데이터 세트를 환자 재원 일수 모델에서 사용하기 위해 결합합니다.

  7. 실험 및 모델 개발은 Azure Databricks에서 수행됩니다. MLflow를 통해 Azure ML과 통합하면 추적, 모델 리포지토리 및 배포를 사용하여 신속한 모델 실험을 할 수 있습니다.

  8. 일괄 채점을 위해 학습된 모델을 Azure Machine Learning Service를 사용하여 Azure Databricks 엔드포인트를 통해 게시하거나 Azure Container Instance 또는 Azure Kubernetes Service를 사용하여 실시간 엔드포인트로 게시합니다.

구성 요소

  • Azure IoT Connector for FHIR은 IoMT(의료 사물 인터넷) 디바이스에서 데이터를 수집하는 기능을 제공하는 Azure API for FHIR의 선택적 기능입니다. 또는 IoT 커넥터를 통한 더 많은 제어와 유연성을 원하는 모든 사용자를 위한 Azure용 IoMT FHIR 커넥터는 IoMT 디바이스에서 데이터를 수집하고 FHIR® 서버에 데이터를 보존하기 위한 오픈 소스 프로젝트입니다.

  • Azure Data Factory는 ETL/ELT 워크플로를 작성하고, 예약하며, 오케스트레이션할 수 있는 하이브리드 데이터 통합 서비스입니다.

  • FHIR용 Azure API는 FHIR 형식의 건강 데이터를 위한 완전 관리형 엔터프라이즈급 서비스입니다.

  • Azure Data Lake Storage는 Azure Blob Storage 기반의 대규모로 확장 가능하고 안전한 데이터 레이크 함수입니다.

  • Azure Databricks는 빠르고 쉬우며 협업이 가능한 Apache Spark 기반 데이터 분석 플랫폼입니다.

  • Azure Machine Learning은 기계 학습 모델을 규모에 맞게 학습, 채점, 배포 및 관리를 위한 클라우드 서비스입니다. 이 아키텍처는 MLflow에 대한 Azure Machine Learning Service의 네이티브 지원을 사용하여 실험을 기록하고, 모델을 저장하고, 모델을 배포합니다.

  • Power BI는 조직 전체에 인사이트를 전달하는 비즈니스 분석 도구 모음입니다. 수백 개의 데이터 원본에 연결하고, 데이터 준비를 간소화하며, 대화형 분석을 수행합니다. 멋진 보고서를 작성한 다음, 조직이 웹 및 모바일 디바이스에서 사용할 수 있도록 보고서를 게시합니다.

시나리오 정보

인구 건강 관리는 증가하는 비용을 관리하고 제어하기 위해 의료 서비스 공급자가 점점 더 많이 사용하고 있는 중요한 도구입니다. 인구 건강 관리의 핵심은 데이터를 사용하여 건강 결과를 향상시키는 것입니다. 추적, 모니터링 및 벤치마킹은 비용을 관리하고 절감하면서 임상 및 건강 결과를 향상시키는 것을 목표로 하는 인구 건강 관리의 세 가지 보루입니다.

인구 건강 관리를 지원하는 기계 학습 애플리케이션의 예로, 재원 기간을 예측하는 모델이 사용됩니다. 이는 병원과 의료 서비스 공급자가 질병 예방 및 관리를 통해 의료비 지출을 관리하고 통제할 수 있게 설계되었습니다. 솔루션에 대한 수동 배포 가이드에서 사용된 데이터 및 재원 기간 모델에 대해 알아볼 수 있습니다. 병원은 이러한 결과를 사용하여 치료 관리 시스템을 최적화하고, 더 긴급한 환자에게 임상 리소스를 집중할 수 있습니다. 병원이 인구 건강 보고를 통해 의료 서비스를 제공하는 지역 사회를 이해하면 비용을 절감하고 더 나은 치료를 제공하는 한편, 서비스 요금 지불에서 가치 기반 치료로 전환하는 데 도움이 될 수 있습니다.

잠재적인 사용 사례

이 솔루션은 의료 산업에 적합합니다. 다음과 같은 시나리오에 사용할 수 있습니다.

  • 환자 모니터링
  • 임상 시험
  • 스마트 클리닉

시나리오 배포

Azure Databricks로 가져올 수 있는 두 가지 샘플 프로젝트가 여기에 자세히 설명되어 있습니다. 표준 클러스터 모드는 R 코드 사용으로 인해 재원 기간 예측 Notebook에서 사용해야 합니다. 다음과 같은 경우에 이 솔루션을 배포할 수 있습니다.

  1. 재원 기간 예측이 포함된 라이브 인구 건강 보고서는 백만 명 정도의 환자에 대한 접촉 수준의 레코드를 사용하여 모델을 학습시킵니다. 데이터 스키마가 HCUP(Healthcare Cost and Utilization Project)의 SID(State Inpatient Databases) 데이터와 매칭되어 실제 HCUP 데이터에서 솔루션의 사용을 용이하게 합니다. 이는 유사한 환자 인구에 사용하기에 적합하지만, 병원은 최상의 결과를 위해 자체 환자 기록 데이터를 사용하여 모델을 재학습시키는 것이 좋습니다. 이 솔루션은 23개 병원의 약 100만 명의 환자에 대해 연령, 성별, 우편 번호, 진단, 절차, 요금 등을 포함한 610개의 임상 및 인구 통계학적 기능을 시뮬레이션합니다. 새로 입원한 환자에게 적용하려면 입원 시 각 환자에게 제공되는 기능만 사용하여 모델을 학습시켜야 합니다.

  2. 환자별 재입원 예측 및 의료 중재(Patient-specific Readmission Prediction and Intervention for Health Care)는 처음에 1994년 의료 분야의 AI에 대한 AAI 봄 심포지엄을 위해 생성되었지만 현재 Michael Kahn 박사에 의해 UCI 기계 학습 리포지토리에 아낌없이 공유된 당뇨병 데이터 세트를 사용합니다.

참가자

Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.

보안 주체 작성자:

다음 단계

제품 설명서: