Azure 안정성
중요 업무용 시스템을 안심하고 설계 및 운영하는 데 필요한 도구와 교육을 이용할 수 있습니다.
안정성은 공동 책임임
Azure 클라우드 플랫폼의 복원력이 뛰어난 기반에서 시작하여 모든 워크로드에 대한 조직의 안정성 목표를 달성하세요. Azure는 투명성에 우선 순위를 두어 항상 최신 정보를 제공하고 서비스 문제 발생 시 신속하게 대응하기 때문에 클라우드를 신뢰할 수 있으므로 안심하고 중요 업무용 애플리케이션을 설계하고 운영할 수 있습니다.
Azure에서 기존 애플리케이션을 최적화하려는 경우 5가지 핵심 요소(안정성, 보안, 성능 효율성, 비용 최적화, 뛰어난 운영) 중에서 지침 원칙 모음인 Azure Well-Architected Framework를 시작하세요.
Azure 인프라에서 안정적인 토대로 시작
Azure CTO 겸 기술 선임 연구원인 Mark Russinovich의 안정성 향상 블로그 시리즈에서 클라우드 플랫폼 안정성을 유지 및 개선하기 위해 진행 중인 Microsoft 투자에 대해 알아보세요. 여기서 최근 4개의 주제인 인텔리전트 소프트웨어를 통한 네트워크 안정성, AIOps를 통한 안전한 개발(Gandalf 소개), 대규모 분산 시스템을 위한 복원력 위협 모델링, 영향이 적거나 없는 유지 관리를 확인할 수 있습니다.
Microsoft 네트워크는 전 세계의 60개 이상 Azure 지역, 200개 Azure 데이터 센터, 190개 에지 사이트, 175,000마일 이상의 길이에 달하는 지상 및 해저 섬유를 연결하고 전략적인 글로벌 에지 로그인 지점에서 나머지 인터넷에 연결합니다. 이 두 부분으로 구성된 블로그 게시물에서 Microsoft 네트워크 안정성에 대해 자세히 알아보세요.
상태 메트릭의 지속적인 모니터링은 배포 프로세스의 기본적인 부분이며, 여기서 AIOps가 중요한 역할을 합니다. 이 블로그 게시물에서 DevOps 엔지니어의 역량을 강화하고, 대규모 Azure 배포 프로세스를 모니터링하고, 문제를 일찍 탐지하고, 영향 범위와 심각도에 따라 롤아웃이나 롤백 결정을 내리기 위해 AI 및 기계 학습이 사용되는 방법을 알아보세요.
Azure 서비스 엔지니어링 팀이 잘못된 일, 잘못된 방식, 중단의 고객 영향 등을 더 잘 이해하기 위한 도구로 “사후 분석”을 사용하고 사후 분석 및 복원력 위협 모델링 프로세스에 대한 인사이트를 얻는 방법을 알아보세요.
Azure에서 고객에게 미치는 영향이나 가동 중지 시간 없이 또는 이를 최소화하여 인프라를 유지 관리하기 위해 사용하는, 영향이 낮거나 영향을 주지 않는 업데이트 기술(핫 패칭, 메모리 보존 유지 관리, 실시간 마이그레이션 등)에 대해 알아보세요.
요구 사항에 맞는 Azure 복원력 기능 선택
앱에서 사용할 수 있는 Azure 고가용성, 재해 복구, 백업 기능을 확인하세요. 또한 사용자에게 적합한 컴퓨팅, 스토리지, 지리적(현지, 영역, 지역) 중복성 옵션을 선택하는 방법을 알아보세요.
기본 제공 복원력 사용
선택적인 Azure 서비스 및 기능을 활용하여 특정 안정성 목표를 달성합니다.
가용성 영역
독립적인 전원, 냉각, 네트워킹을 사용하여 여러 데이터 센터에서 중요한 워크로드를 실행합니다.
가용성 집합
리소스를 함께 배치하거나 분리하여 데이터 센터 내에서 중복성을 구현하세요.
Azure Traffic Manager
자동 장애 조치(failover)를 구현하고, 트래픽을 최적화하고, 온-프레미스 및 클라우드 시스템을 결합합니다.
Azure Site Recovery
기본 사이트에서 보조 위치로 온-프레미스 및 Azure 워크로드를 복제합니다.
Azure Backup
간단하고 안전하며 비용 효율적인 복구 및 복원 솔루션을 사용하여 데이터를 백업합니다.
Azure Storage
모든 시나리오에 대해 중복성 옵션을 사용하여 데이터의 여러 복사본을 만들고 저장합니다.
블랙 박스가 되지 않도록 클라우드 모니터링
모니터링 도구로 변칙을 확인, 진단, 추적하고 안정성 및 성능을 최적화하여 장기적인 안정성을 보장합니다.
Azure Chaos Studio
제어된 비정상 상황을 통해 복원력을 체계적으로 개선합니다.
Azure Service Health
리소스 문제를 확인하고 사용자 지정 가능한 대시보드를 사용하여 문제를 해결합니다.
Azure Monitor
Azure 및 온-프레미스 환경에서 원격 분석 데이터를 수집 및 분석하고 필요한 조치를 수행합니다.
Azure Application Insights
앱 사용에 대한 지능형 인사이트를 얻고 변칙을 진단합니다.
Network Watcher
네트워크 성능과 상태를 모니터링 및 진단하고 인사이트를 얻습니다.
Azure Advisor
사용 원격 분석에 따라 권장 사항을 적용하여 앱과 시스템을 안정성에 최적화합니다.
설명서, 교육 및 리소스
Azure 아키텍처 센터
체계적인 패턴과 모범 사례를 사용하여 안정적인 솔루션 빌드:
Microsoft Learn
다음과 같은 무료 Microsoft Learn 모듈을 사용하여 앱과 시스템의 안정성을 향상하는 데 도움이 되는 새로운 기술을 습득하세요.
SRE(사이트 안정성 엔지니어링)
조직이 시스템, 서비스, 제품에서 적절한 수준의 안정성을 실현하는 데 도움이 되는 분야인 SRE를 사용하는 방법을 알아보세요.