탐색 건너뛰기

Azure 안정성

중요 업무용 시스템을 안심하고 설계 및 운영하는 데 필요한 도구와 교육을 이용할 수 있습니다.

안정성은 공동 책임임

Azure 클라우드 플랫폼의 복원력이 뛰어난 기반에서 시작하여 모든 워크로드에 대한 조직의 안정성 목표를 달성하세요. Azure는 투명성에 우선 순위를 두어 항상 최신 정보를 제공하고 서비스 문제 발생 시 신속하게 대응하기 때문에 클라우드를 신뢰할 수 있으므로 안심하고 중요 업무용 애플리케이션을 설계하고 운영할 수 있습니다.

Azure에서 기존 애플리케이션을 최적화하려는 경우 5가지 핵심 요소(안정성, 보안, 성능 효율성, 비용 최적화, 뛰어난 운영) 중에서 지침 원칙 모음인 Azure Well-Architected Framework를 시작하세요.

Azure 인프라에서 안정적인 토대로 시작

Azure CTO 겸 기술 선임 연구원인 Mark Russinovich의 안정성 향상 블로그 시리즈에서 클라우드 플랫폼 안정성을 유지 및 개선하기 위해 진행 중인 Microsoft 투자에 대해 알아보세요. 여기서 최근 4개의 주제인 인텔리전트 소프트웨어를 통한 네트워크 안정성, AIOps를 통한 안전한 개발(Gandalf 소개), 대규모 분산 시스템을 위한 복원력 위협 모델링, 영향이 적거나 없는 유지 관리를 확인할 수 있습니다.

Microsoft 네트워크는 전 세계의 60개 이상 Azure 지역, 200개 Azure 데이터 센터, 190개 에지 사이트, 175,000마일 이상의 길이에 달하는 지상 및 해저 섬유를 연결하고 전략적인 글로벌 에지 로그인 지점에서 나머지 인터넷에 연결합니다. 이 두 부분으로 구성된 블로그 게시물에서 Microsoft 네트워크 안정성에 대해 자세히 알아보세요.

상태 메트릭의 지속적인 모니터링은 배포 프로세스의 기본적인 부분이며, 여기서 AIOps가 중요한 역할을 합니다. 이 블로그 게시물에서 DevOps 엔지니어의 역량을 강화하고, 대규모 Azure 배포 프로세스를 모니터링하고, 문제를 일찍 탐지하고, 영향 범위와 심각도에 따라 롤아웃이나 롤백 결정을 내리기 위해 AI 및 기계 학습이 사용되는 방법을 알아보세요.

Azure 서비스 엔지니어링 팀이 잘못된 일, 잘못된 방식, 중단의 고객 영향 등을 더 잘 이해하기 위한 도구로 “사후 분석”을 사용하고 사후 분석 및 복원력 위협 모델링 프로세스에 대한 인사이트를 얻는 방법을 알아보세요.

Azure에서 고객에게 미치는 영향이나 가동 중지 시간 없이 또는 이를 최소화하여 인프라를 유지 관리하기 위해 사용하는, 영향이 낮거나 영향을 주지 않는 업데이트 기술(핫 패칭, 메모리 보존 유지 관리, 실시간 마이그레이션 등)에 대해 알아보세요.

요구 사항에 맞는 Azure 복원력 기능 선택

앱에서 사용할 수 있는 Azure 고가용성, 재해 복구, 백업 기능을 확인하세요. 또한 사용자에게 적합한 컴퓨팅, 스토리지, 지리적(현지, 영역, 지역) 중복성 옵션을 선택하는 방법을 알아보세요.

다양한 Azure 서비스가 다양한 복원 기능을 제공하는 방법을 보여주는 인포그래픽 PDF

기본 제공 복원력 사용

선택적인 Azure 서비스 및 기능을 활용하여 특정 안정성 목표를 달성합니다.

가용성 영역

독립적인 전원, 냉각, 네트워킹을 사용하여 여러 데이터 센터에서 중요한 워크로드를 실행합니다.

가용성 집합

리소스를 함께 배치하거나 분리하여 데이터 센터 내에서 중복성을 구현하세요.

Azure Traffic Manager

자동 장애 조치(failover)를 구현하고, 트래픽을 최적화하고, 온-프레미스 및 클라우드 시스템을 결합합니다.

Azure Site Recovery

기본 사이트에서 보조 위치로 온-프레미스 및 Azure 워크로드를 복제합니다.

Azure Backup

간단하고 안전하며 비용 효율적인 복구 및 복원 솔루션을 사용하여 데이터를 백업합니다.

Azure Storage

모든 시나리오에 대해 중복성 옵션을 사용하여 데이터의 여러 복사본을 만들고 저장합니다.

블랙 박스가 되지 않도록 클라우드 모니터링

모니터링 도구로 변칙을 확인, 진단, 추적하고 안정성 및 성능을 최적화하여 장기적인 안정성을 보장합니다.

Azure Chaos Studio

제어된 비정상 상황을 통해 복원력을 체계적으로 개선합니다.

Azure Service Health

리소스 문제를 확인하고 사용자 지정 가능한 대시보드를 사용하여 문제를 해결합니다.

Azure Monitor

Azure 및 온-프레미스 환경에서 원격 분석 데이터를 수집 및 분석하고 필요한 조치를 수행합니다.

Azure Application Insights

앱 사용에 대한 지능형 인사이트를 얻고 변칙을 진단합니다.

Network Watcher

네트워크 성능과 상태를 모니터링 및 진단하고 인사이트를 얻습니다.

Azure Advisor

사용 원격 분석에 따라 권장 사항을 적용하여 앱과 시스템을 안정성에 최적화합니다.

모든 규모의 조직에서 신뢰할 수 있는 안정성

인프라 복원력, 고객 신뢰 및 경쟁력 있는 가치를 구축한 ClearBank

"Ensuring end-to-end reliability and resiliency is a team effort. We get the tools from Azure, and we set up the systems and processes to put it all together."

Tom Harris, 최고 기술 책임자, ClearBank
ClearBank

Kodak Alaris, ERP 복원력을 개선하여 생산성 향상

"The one thing I don't want is my CIO coming to me because there's a problem with our ERP. The truth is, it never happens anymore—it's a real testament to our ERP's reliability in Azure."

– Joseph Calabrese, Kodak Alaris의 IT 운영 관리자
Kodak Alaris

The University of Drives는 Microsoft Azure 통해 안정성을 향상시킵니다

"Whenever we think of a solution, we think, 'How can we do this in the cloud versus on-premises?' It not only makes us more resilient, but more flexible and nimble as well."

Newton Lovo, IT 담당 이사, Cloud Infrastructure Services, University of Binding
마이애미 대학교

더 안정적이고 신뢰할 수 있는 서비스를 제공하는 Marie Curie

"In the last two and a half years, we've had one outage which has been due to cloud infrastructure failing. It just almost instantly gave us stability, space to breathe, enabled us to focus on bringing real value to the organization."

Ivan Delany, IT 책임자, Marie Curie
Marie Curie

인시던트 플랫폼의 안정성과 무결성을 촉진한 Juvare

"We architected our solution to spread workloads across different availability zones and regions, to maintain both client requirements for geographic data residency but also to ensure that if one particular part of our infrastructure was having a problem, it reduced the blast radius."

Bryan Kaplan, 최고 정보 책임자, Juvare
Juvare

물류 플랫폼의 안정성을 개선한 GEP

"We use AKS or Azure Kubernetes Service inbuilt node pools...say your primary node pool is down, within the cluster you're automatically able to failover to the second availability zone."

Nithin Prasad, 수석 엔지니어, GEP
gep

설명서, 교육 및 리소스

Azure 아키텍처 센터

체계적인 패턴과 모범 사례를 사용하여 안정적인 솔루션 빌드:

Microsoft Learn

다음과 같은 무료 Microsoft Learn 모듈을 사용하여 앱과 시스템의 안정성을 향상하는 데 도움이 되는 새로운 기술을 습득하세요.

SRE(사이트 안정성 엔지니어링)

조직이 시스템, 서비스, 제품에서 적절한 수준의 안정성을 실현하는 데 도움이 되는 분야인 SRE를 사용하는 방법을 알아보세요.

Azure Well-Architected Framework의 5가지 아키텍처 핵심 요소 중 하나인 안정성을 위한 설계에 대한 자세한 정보

자세한 내용
무엇을 도와 드릴까요?