Trace Id is missing
주 콘텐츠로 건너뛰기

Azure 안정성

중요 업무용 시스템을 안심하고 설계 및 운영하는 데 필요한 도구와 교육을 이용할 수 있습니다.

안정성은 공동 책임임

Azure 클라우드 플랫폼의 복원력이 뛰어난 기반에서 시작하여 모든 워크로드에 대한 조직의 안정성 목표를 달성하세요. Azure는 투명성에 우선 순위를 두어 항상 최신 정보를 제공하고 서비스 문제 발생 시 신속하게 대응하기 때문에 클라우드를 신뢰할 수 있으므로 안심하고 중요 업무용 애플리케이션을 설계하고 운영할 수 있습니다. 
 Azure에서 기존 애플리케이션을 최적화하려는 경우 5가지 핵심 요소(안정성, 보안, 성능 효율성, 비용 최적화, 뛰어난 운영) 중에서 지침 원칙 모음인 Azure Well-Architected Framework를 시작하세요.

Azure 클라우드 플랫폼의 안정성과 복원력 있는 기능을 필요에 따라 사용하여 매우 안정적이고 복원력 있는 앱을 구현하는 방법을 보여주는 다이어그램

Azure 인프라에서 안정적인 토대로 시작

Azure CTO 겸 기술 선임 연구원인 Mark Russinovich의 안정성 향상 블로그 시리즈에서 클라우드 플랫폼 안정성을 유지 및 개선하기 위해 진행 중인 Microsoft 투자에 대해 알아보세요. 여기서 최근 4개의 주제인 인텔리전트 소프트웨어를 통한 네트워크 안정성, AIOps를 통한 안전한 개발(Gandalf 소개), 대규모 분산 시스템을 위한 복원력 위협 모델링, 영향이 적거나 없는 유지 관리를 확인할 수 있습니다.

Microsoft 네트워크는 전 세계의 60개 이상 Azure 지역, 200개 Azure 데이터 센터, 190개 에지 사이트, 175,000마일 이상의 길이에 달하는 지상 및 해저 섬유를 연결하고 전략적인 글로벌 에지 로그인 지점에서 나머지 인터넷에 연결합니다. 이 두 부분으로 구성된 블로그 게시물에서 Microsoft 네트워크 안정성에 대해 자세히 알아보세요.

상태 메트릭의 지속적인 모니터링은 배포 프로세스의 기본적인 부분이며, 여기서 AIOps가 중요한 역할을 합니다. 이 블로그 게시물에서 DevOps 엔지니어의 역량을 강화하고, 대규모 Azure 배포 프로세스를 모니터링하고, 문제를 일찍 탐지하고, 영향 범위와 심각도에 따라 롤아웃이나 롤백 결정을 내리기 위해 AI 및 기계 학습이 사용되는 방법을 알아보세요.

Azure 서비스 엔지니어링 팀이 잘못된 일, 잘못된 방식, 중단의 고객 영향 등을 더 잘 이해하기 위한 도구로 “사후 분석”을 사용하고 사후 분석 및 복원력 위협 모델링 프로세스에 대한 인사이트를 얻는 방법을 알아보세요.

Azure에서 고객에게 미치는 영향이나 가동 중지 시간 없이 또는 이를 최소화하여 인프라를 유지 관리하기 위해 사용하는, 영향이 낮거나 영향을 주지 않는 업데이트 기술(핫 패칭, 메모리 보존 유지 관리, 실시간 마이그레이션 등)에 대해 알아보세요.

탭으로 돌아가기

요구 사항에 맞는 Azure 복원력 기능 선택

앱에서 사용할 수 있는 Azure 고가용성, 재해 복구, 백업 기능을 확인하세요. 또한 사용자에게 적합한 컴퓨팅, 스토리지, 지리적(현지, 영역, 지역) 중복성 옵션을 선택하는 방법을 알아보세요.

각각 다른 복원력 기능을 제공하는 다양한 Azure 서비스를 보여주는 인포그래픽 PDF

기본 제공 복원력 사용

선택적인 Azure 서비스 및 기능을 활용하여 특정 안정성 목표를 달성합니다.

가용성 영역

독립적인 전원, 냉각, 네트워킹을 사용하여 여러 데이터 센터에서 중요한 워크로드를 실행합니다.

가용성 집합

리소스를 함께 배치하거나 분리하여 데이터 센터 내에서 중복성을 구현하세요.

Azure Traffic Manager

자동 장애 조치(failover)를 구현하고, 트래픽을 최적화하고, 온-프레미스 및 클라우드 시스템을 결합합니다.

Azure Site Recovery

기본 사이트에서 보조 위치로 온-프레미스 및 Azure 워크로드를 복제합니다.

Azure Backup

간단하고 안전하며 비용 효율적인 복구 및 복원 솔루션을 사용하여 데이터를 백업합니다.

Azure Storage

모든 시나리오에 대해 중복성 옵션을 사용하여 데이터의 여러 복사본을 만들고 저장합니다.

블랙 박스가 되지 않도록 클라우드 모니터링

모니터링 도구로 변칙을 확인, 진단, 추적하고 안정성 및 성능을 최적화하여 장기적인 안정성을 보장합니다.

Azure Chaos Studio

제어된 비정상 상황을 통해 복원력을 체계적으로 개선합니다.

Azure Service Health

리소스 문제를 확인하고 사용자 지정 가능한 대시보드를 사용하여 문제를 해결합니다.

Azure Monitor

Azure 및 온-프레미스 환경에서 원격 분석 데이터를 수집 및 분석하고 필요한 조치를 수행합니다.

Azure Application Insights

앱 사용에 대한 지능형 인사이트를 얻고 변칙을 진단합니다.

Network Watcher

네트워크 성능과 상태를 모니터링 및 진단하고 인사이트를 얻습니다.

Azure Advisor

사용 원격 분석에 따라 권장 사항을 적용하여 앱과 시스템을 안정성에 최적화합니다.

모든 규모의 조직에서 신뢰할 수 있는 안정성

인프라 복원력, 고객 신뢰 및 경쟁력 있는 가치를 구축한 ClearBank

"엔드투엔드 안정성과 복원력을 보장하기 위해 팀 전체가 노력해야 합니다. 당사는 Azure에서 도구를 가져온 후 함께 결합하기 위해 시스템 및 프로세스를 설정합니다."

Tom Harris, 최고 기술 책임자, ClearBank

Clear Bank

Microsoft Azure를 통해 안정성을 개선하는 University of Miami

"솔루션을 고려할 때 '클라우드와 온-프레미스에서 어떻게 할 수 있을까?'를 생각합니다. 당사를 더 복원력 있게 만들 뿐만 아니라 더 유연하고 민첩하게 만들어 줍니다."

Mari Lovo, IT 및 클라우드 인프라 서비스 책임자, University of Miami

University of Miami

더 안정적이고 신뢰할 수 있는 서비스를 제공하는 Marie Curie

"지난 2년 반 동안 클라우드 인프라 장애로 인해 한 번의 운영 중단을 겪었습니다. 이 솔루션은 즉각적으로 안정성과 숨 쉴 공간을 제공하고 조직에 실질적인 가치를 제공하는 데 집중할 수 있도록 도와주었습니다."

Ivan Delany, IT 책임자, Marie Curie

Marie Curie

인시던트 플랫폼의 안정성과 무결성을 촉진한 Juvare

"당사는 다양한 가용성 영역과 지역에서 워크로드를 분산하고, 지리 데이터 보존에 대한 클라이언트 요구를 충족하면서 인프라의 특정 부분에서 문제가 발생할 경우에 블라스트 반경을 줄일 수 있도록 솔루션을 설계했습니다." 

Bryan Kaplan, 최고 정보 책임자, Juvare

Juvare

물류 플랫폼의 안정성을 개선한 GEP

"당사는 AKS 또는 Azure Kubernetes Service 기본 제공 노드 풀을 사용합니다. 따라서 기본 노드 풀이 중단되면 클러스터 내에서 두 번째 가용성 영역으로 자동으로 장애 조치(failover)할 수 있습니다." 

Nithin Prasad, 수석 엔지니어, GEP

gep
탭으로 돌아가기

설명서, 교육 및 리소스

Azure 아키텍처 센터

체계적인 패턴과 모범 사례를 사용하여 안정적인 솔루션 빌드:

Microsoft Learn

다음과 같은 무료 Microsoft Learn 모듈을 사용하여 앱과 시스템의 안정성을 향상하는 데 도움이 되는 새로운 기술을 습득하세요.

SRE(사이트 안정성 엔지니어링)

조직이 시스템, 서비스, 제품에서 적절한 수준의 안정성을 실현하는 데 도움이 되는 분야인 SRE를 사용하는 방법을 알아보세요.

Azure Well-Architected Framework의 5가지 아키텍처 핵심 요소 중 하나인 안정성을 위한 설계에 대한 자세한 정보