복원력을 위한 Azure ExpressRoute 디자인 및 설계

Azure ExpressRoute는 온-프레미스 네트워크와 Azure 워크로드 간의 짧은 대기 시간, 복원력, 높은 처리량 프라이빗 연결에 널리 사용되는 필수 하이브리드 연결 서비스입니다. 온-프레미스와 Azure 간의 네트워크 연결에서 안정성, 복원력 및 재해 복구를 달성하여 비즈니스 및 중요 업무용 워크로드의 가용성을 보장하는 기능을 제공합니다. 또한 이 기능은 확장 가능하고 비용 효율적인 방식으로 Azure 리소스에 대한 액세스 권한을 확장합니다.

ExpressRoute를 통한 온-프레미스 네트워크와 Azure 간의 연결을 보여 주는 다이어그램.

안정성, 복원력, 가용성이 뛰어난 네트워크 연결은 잘 구성된 시스템의 기본입니다. 안정성은 복원력가용성이라는 두 가지 원칙으로 구성됩니다. 복원력의 목표는 오류를 방지하고 오류가 발생할 경우 애플리케이션을 완전한 작동 상태로 복원하는 것입니다. 가용성의 목표는 애플리케이션이나 워크로드에 대한 일관된 액세스 권한을 제공하는 것입니다. 비즈니스 요구 사항과 애플리케이션 요구 사항을 기반으로 안정성을 적극적으로 계획해야 합니다.

ExpressRoute 사용자는 에지 사이트, WAN 및 가용성 영역의 가용성과 성능에 의존하여 Azure에 대한 연결을 유지합니다. 그러나 이러한 구성 요소 또는 사이트는 장비 오작동, 네트워크 중단, 기상 조건 또는 자연 재해와 같은 다양한 이유로 인해 오류가 발생할 수 있습니다. 따라서 안정성, 복원력 및 가용성을 계획하는 것은 사용자와 클라우드 공급자 간의 공동 책임입니다.

ExpressRoute에 대한 사이트 복원력

온-프레미스와 Azure 간의 네트워크 연결에서 고가용성과 복원력을 보장하는 데 사용할 수 있는 세 가지 ExpressRoute 복원력 아키텍처가 있습니다. 이러한 아키텍처 디자인에는 다음이 포함됩니다.

최대 복원력

ExpressRoute의 최대 복원력 아키텍처는 Microsoft 네트워크 경로 내에서 단일 실패 지점을 제거하도록 구성되었습니다. 이 설정은 ExpressRoute를 사용하여 사이트 다양성을 위해 서로 다른 두 위치에 걸쳐 회로 쌍을 구성하여 수행됩니다. 최대 복원력의 목표는 안정성, 복원력 및 가용성을 향상하여 결과적으로 비즈니스 및/또는 중요 업무용 워크로드에 대해 최고 수준의 복원력을 보장하는 것입니다. 이러한 작업의 경우 최대 복원력을 구성하는 것이 좋습니다. 이 아키텍처 디자인은 안정성 핵심 요소 아래 Well Architected 프레임워크의 일부로 권장됩니다. ExpressRoute 엔지니어링 팀은 최대 복원력을 구성하는 데 도움이 되는 단계별 포털 환경을 개발했습니다.

온-프레미스 네트워크와 Microsoft 사이의 서로 다른 두 피어링 위치에 구성된 한 쌍의 ExpressRoute 회로를 보여 주는 다이어그램.

높은 복원력

다중 사이트 또는 사이트 복원력이라고도 하는 높은 복원력을 사용하면 동일한 대도시(메트로) 지역 내의 여러 사이트를 사용하여 ExpressRoute를 통해 온-프레미스 네트워크를 Azure에 연결할 수 있습니다. 높은 복원력은 단일 회로를 두 사이트에 걸쳐 분할하여 사이트 다양성을 제공합니다. 첫 번째 연결은 한 사이트에서 설정되고 두 번째 연결은 다른 사이트에서 설정됩니다. 다중 사이트 복원력의 목표는 사이트 다양성을 지원하는 기능을 도입하여 에지 사이트 격리 및 오류의 영향을 완화하는 것입니다. 사이트 다양성은 대도시 내의 쌍을 이루는 사이트 전체에서 단일 회선을 사용하여 달성되며, 이는 에지와 지역 간의 장애에 대한 복원력을 제공합니다. 높은 복원력은 표준 복원력보다 더 높은 수준의 사이트 복원력을 제공하지만 최대 복원력만큼은 아닙니다. 높은 복원력은 두 사이트 간의 대기 시간 패리티를 통해 표준 복원력과 가격이 동일합니다. 이 아키텍처는 지역 내 비즈니스 및 중요 업무용 워크로드에 사용할 수 있습니다. 자세한 내용은 ExpressRoute Metro를 참조하세요.

각 링크가 두 개의 서로 다른 피어링 위치에 구성된 단일 ExpressRoute 회로를 보여 주는 다이어그램.

표준 복원력

ExpressRoute의 표준 복원력은 단일 사이트에 구성된 두 개의 연결이 있는 단일 회로입니다. 기본 제공된 이중화(Active-Active)는 회로의 두 연결에 걸쳐 장애 조치(failover)를 용이하게 하도록 구성됩니다. 현재 ExpressRoute는 단일 피어링 위치에서 두 개의 연결을 제공합니다. 이 사이트에서 오류가 발생하면 사용자는 Azure 워크로드에 대한 연결이 끊길 수 있습니다. 이 구성은 하나의 피어링 위치로만 구성된 ExpressRoute 회로를 사용하는 사용자를 나타내므로 단일 홈이라고도 합니다. 이 구성은 사이트 복원력을 제공하지 않기 때문에 복원력이 가장 낮고 비즈니스 또는 중요 업무용 워크로드에 대해 권장되지 않는 것으로 간주됩니다.

각 링크가 단일 피어링 위치에 구성된 단일 ExpressRoute 회로를 보여 주는 다이어그램.

ExpressRoute에 대한 영역 복원력

Azure 지역은 ExpressRoute 디자인 및 복원력 전략의 핵심 부분입니다. 이러한 지역은 Azure 서비스를 호스팅하는 데이터 센터의 지리적 위치입니다. 지역은 대기 시간이 짧은 전용 네트워크를 통해 상호 연결되며 가용성, 내결함성, 확장성이 뛰어나도록 설계되었습니다.

Azure는 지역 복원력을 보장하기 위한 여러 기능을 제공합니다. 그러한 기능 중 하나가 가용성 영역입니다. 가용성 영역은 한 지역 내의 여러 실제 위치에 걸쳐 데이터 센터 오류로부터 애플리케이션과 데이터를 보호합니다. 지역 및 가용성 영역은 애플리케이션 디자인 및 복원력 전략의 핵심입니다. 가용성 영역을 활용하면 배포에서 더 높은 가용성과 복원력을 얻을 수 있습니다. 자세한 내용은 지역 및 가용성 영역을 참조하세요.

지역 내 가용성 영역 전체에 걸쳐 영역 중복으로 ExpressRoute 가상 네트워크 게이트웨이를 배포하는 것이 좋습니다. 이러한 가용성 영역은 독립적인 인프라(전력, 냉각 및 네트워킹)를 갖춘 별도의 실제 위치입니다. 목적은 영역 수준 오류로부터 Azure에 대한 온-프레미스 네트워크 연결을 보호하는 것입니다. 영역 중복 ExpressRoute 게이트웨이는 Azure에서 중요 업무용 서비스에 액세스하기 위한 복원력, 확장성 및 더 높은 가용성을 제공합니다.

지역 및 영역 데이터 센터의 장비 오류 또는 재해는 가상 네트워크의 ExpressRoute 게이트웨이 배포에 영향을 미칠 수 있습니다. 게이트웨이가 영역 중복으로 배포되지 않은 경우 Azure 데이터 센터 내의 이러한 오류는 사용자가 Azure 워크로드에 액세스하는 기능에 영향을 미칠 수 있습니다.

기존 비영역 중복 ExpressRoute 게이트웨이가 있는 경우 이제 가용성 영역 지원 게이트웨이로 마이그레이션할 수 있습니다.

권장 사항

다음은 ExpressRoute 네트워크 아키텍처의 고가용성, 복원력 및 안정성을 보장하기 위한 권장 사항입니다.

ExpressRoute 회로 권장 사항

ExpressRoute 회로 또는 ExpressRoute Direct 계획

초기 계획 단계에서는 ExpressRoute 회로 또는 ExpressRoute Direct 연결을 구성할지 여부를 결정해야 합니다. ExpressRoute 회로를 사용하면 연결 공급자의 지원을 받아 Azure에 대한 비공개 전용 연결을 사용할 수 있습니다. ExpressRoute Direct를 사용하면 온-프레미스 네트워크를 피어링 위치의 Microsoft 네트워크로 직접 확장할 수 있습니다. 또한 비즈니스 요구 사항을 충족하려면 대역폭 요구 사항과 회로 SKU 형식 요구 사항을 식별해야 합니다.

다중 사이트 중복 ExpressRoute 회로의 복원력 평가

최대 복원력으로 다중 사이트 중복 ExpressRoute 회로를 배포한 후에는 다중 사이트 중복의 이점을 최대한 활용하기 위해 중복 회로를 통해 온-프레미스 경로가 보급되는지 확인해야 합니다. 복원력을 평가하고 중복 회로 및 경로의 장애 조치(failover)를 테스트하려면 여기에서 자세히 알아봅니다.

활성-활성 구성 계획

복원력과 가용성을 개선하기 위해 Microsoft는 활성-활성 모드에서 ExpressRoute 회로의 두 연결을 모두 작동하는 것이 좋습니다. 이 모드에서 두 개의 연결이 작동하도록 허용함으로써 Microsoft는 흐름별로 연결 전반에 걸쳐 네트워크 트래픽의 부하를 분산합니다.

실제 계층 다양성

복원력을 높이려면 온-프레미스 에지와 피어링 위치(공급자/Microsoft Edge 위치) 사이에 여러 경로를 설정하도록 계획합니다. 이 구성은 다양한 서비스 공급자를 활용하거나 온-프레미스 네트워크에서 다른 피어링 위치를 통해 라우팅하여 달성할 수 있습니다. 고가용성을 구현하려면 엔드투엔드 네트워크 아키텍처 전체에서 ExpressRoute 회로의 중복성을 유지 관리하는 것이 중요합니다. 여기에는 온-프레미스 네트워크 내 중복성 유지와 서비스 공급자 내 중복성 유지가 포함됩니다. 아키텍처의 이러한 부분에서 중복성을 보장한다는 것은 단일 실패 지점이 있어서는 안 된다는 것을 의미합니다.

BFD(양방향 전달 검색)가 사용하도록 설정 및 구성되어 있는지 확인

ExpressRoute를 통해 BFD(양방향 전달 검색)를 사용하도록 설정하면 MSEE 디바이스와 ExpressRoute 회로가 구성된 라우터 간의 링크 오류 검색을 가속화할 수 있습니다. Microsoft에서는 BFD를 사용하여 CPE(Customer Premises Edge) 디바이스를 구성하는 것이 좋습니다. ExpressRoute는 에지 라우팅 디바이스 또는 파트너 에지 라우팅 디바이스를 통해 구성될 수 있습니다. BFD는 Microsoft 측의 MSEE 디바이스에서 기본적으로 사용하도록 설정됩니다.

ExpressRoute 게이트웨이 권장 사항

가상 네트워크 게이트웨이 계획

복원력을 높이기 위해 영역 중복 Virtual Network 게이트웨이를 만들고 재해 복구 및 고가용성을 위해 다양한 지역에 가상 네트워크 게이트웨이를 계획합니다. 영역 중복 게이트웨이를 활용하면 Azure에서 중요 업무용 및 확장성 있는 서비스에 액세스하기 위한 영역 복원력의 이점을 활용할 수 있습니다.

영역 중복 ExpressRoute 게이트웨이로 마이그레이션

게이트웨이 마이그레이션 단계별 환경을 통해 비 Az 지원 SKU에서 Az 지원 SKU 게이트웨이로 쉽게 마이그레이션할 수 있습니다. 이 기능을 사용하면 동일한 게이트웨이 서브넷 내에 추가 가상 네트워크 게이트웨이를 만들 수 있습니다. 마이그레이션 프로세스 중에 Azure는 기존 게이트웨이에서 새 게이트웨이로 컨트롤 플레인 및 데이터 경로 구성을 전송합니다.

재해 복구 및 고가용성 권장 사항

고가용성 및 재해 복구 지원

가용성을 최대화하려면 ExpressRoute 회로의 고객 및 서비스 공급자 세그먼트 모두 가용성 및 복원력을 고려하여 설계되어야 합니다. 재해 복구를 위해 자연 재해로 인한 지역 서비스 중단과 같은 시나리오를 계획합니다. 다양한 지역의 다양한 피어링 위치를 통해 구성된 여러 회로에 대한 강력한 재해 복구 디자인을 구현합니다. 자세한 내용은 재해 복구를 위한 디자인를 참조하세요.

지리적 중복 계획

재해 복구 계획을 위해서는 여러 피어링 위치 및 지역에 ExpressRoute 회로를 설정하는 것이 좋습니다. ExpressRoute 회로는 동일한 대도시 지역 또는 서로 다른 대도시 지역에 만들어질 수 있으며, 각 회로를 통한 다양한 경로에 대해 서로 다른 서비스 공급자를 사용할 수 있습니다. 지역 중복 ExpressRoute 회로는 재해 복구를 위한 강력한 백 엔드 네트워크 연결을 만드는 데 활용됩니다. 자세한 내용은 고가용성을 위한 디자인를 참조하세요.

참고 항목

대기 시간에 민감하거나 중요 업무용 또는 대역폭을 많이 사용하는 워크로드를 처리할 때는 사이트 간 VPN을 ExpressRoute 연결을 위한 백업 솔루션으로 사용하지 않는 것이 좋습니다. 이러한 경우 최대 가용성을 보장하기 위해 ExpressRoute 다중 사이트 복원력을 사용하여 재해 복구를 설계하는 것이 좋습니다.

가상 네트워크 간 연결을 위한 가상 네트워크 피어링

VNet(Virtual Network) 피어링은 Azure 서비스가 가상 네트워크 게이트웨이, 추가 홉 또는 공용 인터넷을 통한 전송 없이도 Virtual Network 간에 통신할 수 있도록 하는 보다 효율적이고 직접 메서드를 제공합니다. 가상 네트워크 간의 연결을 설정하려면 가능한 최상의 성능을 위해 VNet 피어링에 구현해야 합니다. 자세한 내용은 가상 네트워크 피어링 정보VNet 피어링 관리를 참조하세요.

모니터링 및 경고 권장 사항

ExpressRoute 회로에 대한 모니터링 및 경고 구성

기본적으로 Azure Monitor 내에서 Network Insights를 구성하여 ExpressRoute Direct 및 Global Reach를 포함한 모든 ExpressRoute 회로 메트릭을 보는 것이 좋습니다. 회로 카드 내에서 피어링, 연결 및 게이트웨이에 대한 토폴로지 및 종속성을 시각화할 수 있습니다. 회로에 사용할 수 있는 인사이트에는 가용성, 처리량 및 패킷 삭제가 포함됩니다.

ExpressRoute 회로 유지 관리 경고에 대한 서비스 상태 경고 구성

ExpressRoute는 Azure Service Health를 사용하여 계획되고 예정된 ExpressRoute 회로 유지 관리를 알립니다. Service Health를 사용하면 Azure Portal에서 계획된 유지 관리와 과거 유지 관리를 보고 요구 사항에 가장 적합한 경고와 알림을 구성할 수 있습니다. Service Health에서는 계획된 유지 관리 및 과거 유지 관리를 확인할 수 있습니다. 또한 예정된 유지 관리에 대한 경고를 받도록 Service Health 내에서 경고를 설정할 수도 있습니다.

ExpressRoute용 연결 모니터 구성

연결 모니터는 Azure 클라우드 배포와 온-프레미스 위치(지점 등) 간 연결을 모니터링하는 클라우드 기반 네트워크 모니터링 솔루션입니다. 연결 모니터는 에이전트 기반 솔루션입니다.

게이트웨이 상태 모니터링 및 경고 구성

ExpressRoute 게이트웨이 가용성, 성능 및 확장성을 위해 Azure Monitor를 사용하여 모니터링을 설정합니다. ExpressRoute 게이트웨이를 배포하면 Azure에서 게이트웨이의 컴퓨팅 및 기능이 관리됩니다. 게이트웨이 성능을 더 잘 이해하는 데 사용할 수 있는 여러 가지 게이트웨이 메트릭이 있습니다.