Navigation überspringen

How Microsoft builds its fast and reliable global network (Wie Microsoft sein schnelles und zuverlässiges globales Netzwerk aufbaut)

Veröffentlicht am 15 März, 2017

Corporate Vice President, Azure Networking

Täglich stellen Kund*innen in aller Welt im Rahmen von vielen Billionen Anforderungen Verbindungen mit Microsoft Azure, Bing, Dynamics 365, Office 365, OneDrive, XBox und vielen weiteren Diensten her. Diese Anforderungen beziehen sich auf verschiedene Datentypen, z. B. Enterprise Cloud-Anwendungen und E-Mail, VoIP, Videostreaming, IoT, Suche und Cloudspeicher.

Kund*innen erwarten von unseren Diensten sofortige Reaktion und hohe Zuverlässigkeit. Das globale Fernnetz (WAN) von Microsoft spielt eine wichtige Rolle dabei, den Kund*innen eine hervorragende Clouddiensterfahrung zu bieten. Unser globales Netzwerk verbindet Hunderte von Rechenzentren in weltweit 38 Regionen und bietet nahezu perfekte Verfügbarkeit, hohe Kapazität und die Flexibilität, auf unvorhersehbare Bedarfsspitzen reagieren zu können.

Beim Erstellen, Erweitern und Ausführen dieses erstklassigen Netzwerks greifen wir auf drei Leitprinzipien zurück:

  • Wir bleiben möglichst dicht an unseren Kund*innen, um eine optimale Latenz zu erreichen.
  • Wir behalten die Kontrolle über Kapazität und Resilienz, um dafür Sorge zu tragen, dass das Netzwerk ggf. auch mehrere Ausfälle übersteht.
  • Wir verwalten den Datenverkehr im Netzwerk umfassend mithilfe softwaredefinierter Netzwerke (Software Defined Networks, SDNs).

So nah an unseren Kund*innen wie möglich

Wenn Sie Microsoft-Dienste in Anspruch nehmen, erwarten Sie bei Bedarf eine schnelle und zuverlässige Reaktion. Daten werden in unserem Netz nahezu mit Lichtgeschwindigkeit übertragen. Dabei ist die Netzgeschwindigkeit (Latenzzeit) eine Funktion der Entfernung zwischen Kunde und Rechenzentrum. Wenn der Abstand zum Dienst sehr groß ist – d. h. wenn beispielsweise Sie in London ansässig sind, der Dienst sich aber in Tokio befindet –, dann bestimmt der Netzwerkpfad die Latenz. Wir setzen innovative Software ein, um das Routing im Netzwerk zu optimieren und Netzwerkpfade zu erstellen und zu implementieren, die möglichst gradlinig zwischen den Kund*innen und ihren Daten und Diensten verlaufen. Dadurch wird die Latenz auf die durch die Lichtgeschwindigkeit vorgegebenen Grenzen reduziert.

Der Kundendatenverkehr gelangt über strategisch platzierte Edgeknoten von Microsoft – unsere Points of Presence – in unser globales Netzwerk. Diese Edgeknoten sind über Tausende von Verbindungen an mehr als 130 Standorten direkt mit mehr als 2.500 individuellen Internetpartnern verbunden. Unsere umfassende Verbindungsstrategie optimiert die Pfade, auf denen die Daten über unser globales Netzwerk geleitet werden. Weniger Latenz, Jitter und Paketverlust bei höherem Durchsatz verbessern die Netzwerkerfahrung unserer Kund*innen. Direktverbindungen bieten Kund*innen eine bessere Dienstqualität im Vergleich zu Transitlinks, da hierbei weniger Hops und Beteiligte einzubinden und die Netzwerkpfade besser sind.

Globales Microsoft-WAN

Abbildung 1. Globales Microsoft-WAN

Azure-Datenverkehr zwischen unseren Rechenzentren bleibt in unserem Netzwerk und fließt nicht über das Internet. Dies umfasst sämtlichen Datenverkehr zwischen Microsoft-Diensten auf der ganzen Welt. Beispielsweise wird innerhalb von Azure Datenverkehr zwischen VMs, Speicher- und SQL-Kommunikation unabhängig von der Quell- und Zielregion nur innerhalb des Microsoft-Netzwerks übertragen. VNET-zu-VNET-Datenverkehr zwischen Regionen sowie regionsübergreifender VNET-zu-VNET-Datenverkehr verbleiben in unserem Microsoft-Netzwerk.

Mithilfe von Azure ExpressRoute können Kund*innen private Netzwerkverbindungen mit Azure, Dynamics 365, Office 365 und Skype for Business erstellen. ExpressRoute-Verbindungen umgehen das Internet und bieten im Vergleich zu normalen Internetverbindungen höhere Zuverlässigkeit und Geschwindigkeit bei geringeren Latenzen. Mit ExpressRoute können Kund*innen eine Verbindung mit Azure an einem ExpressRoute-Speicherort an bestimmten Microsoft-Edgestandorten, z. B. bei einem Internetknotenanbieter, oder aber eine Azure-Direktverbindung aus einem vorhandenen Unternehmens-WAN wie beispielsweise einem von einem Netzwerkdienstanbieter bereitgestellten MPLS-VPN (Multiprotocol Label Switching) herstellen.

Kund*innen können etwa eine Verbindung mit einem lokalen ExpressRoute-Standort in Dallas herstellen und auf virtuelle Computer in Amsterdam, Busan, Dublin, Hongkong, Seoul, Singapur, Sydney, Tokio (oder einem unserer Rechenzentren) zugreifen; der gesamte Datenverkehr verbleibt in diesem Fall innerhalb unseres globalen Backbonenetzwerks. Wir betreiben gegenwärtig insgesamt 37 ExpressRoute-Standorte, die jeweils einer Azure-Region zugewiesen sind oder sich an weiteren strategischen Positionen befinden, und weitere sind geplant. Jedes Mal, wenn wir eine neue Azure-Region ankündigen – wie beispielsweise kürzlich in Südkorea –, können Sie davon ausgehen, dass ExpressRoute und auch unser globales Ökosystem mit ExpressRoute-Partnern dort ebenfalls verfügbar sein werden.

ExpressRoute-Partner

Abbildung 2: Ausschnitt aus dem Microsoft ExpressRoute-Partnerökosystem, zu dem die weltweit größten Netzwerk- und Colocationanbieter gehören

Kontrolle über Kapazitäten behalten und Resilienz implementieren

Damit wir unseren Kund*innen einen Dienst anbieten können, der einwandfrei funktioniert, muss unser Netzwerk Fehler behandeln und sich schnell an Bedarfsspitzen anpassen können. Um das enorme Wachstum unserer Clouddienste unterstützen und konsistente SLAs erfüllen zu können, investieren wir bei unseren unter- und überirdischen Leitungen sowie Seekabeln in private Glasfaser (so genannte Dark Fiber). Microsoft besitzt und betreibt eines der größten Backbonenetzwerke der Welt, um Rechenzentren und Kund*innen miteinander zu verbinden. In den vergangenen drei Jahren haben wir unsere WAN-Fernübertragungskapazität um 700 Prozent erhöht. Innerhalb einer bestimmten Region können wir zwischen Rechenzentren Bandbreiten von bis zu 1,6 PBit/s unterstützen. Wir erhöhen unsere Kapazitäten fortlaufend weiter, um der hohen Nachfrage nach Microsoft-Clouddiensten zu begegnen.

Microsoft besitzt und betreibt einen der größten WAN-Backbones weltweit.

Unsere Investitionen in Unterseestrecken verbessern Resilienz, Leistungsfähigkeit und Zuverlässigkeit bei Übertragungswegen über Pazifik und Atlantik. Unsere neueste Investition ist das MAREA-Kabel, ein 6.600 km langes Seekabel zwischen Virginia Beach (USA) und Spanien, das wir gemeinsam mit Facebook entwickelt haben. MAREA wird das kapazitätsstärkste Unterseekabel über den Atlantik sein. Es umfasst acht Glasfaserpaare und ist zunächst für eine geschätzte Übertragungsrate von 160 TBit/s konzipiert. Dieses Open-Cable-System ist im Hinblick auf die Konstruktion und Leistungsfähigkeit des Kabels hochinnovativ, steigert die Bandbreitenkapazitäten und senkt Kosten. Noch wichtiger aber ist, dass es uns die Möglichkeit bietet, SDN-Prinzipien in die Kabelverwaltung einzubringen, was zu einer höheren Servicequalität führt.

In den vergangenen drei Jahren haben wir unsere WAN-Fernübertragungskapazität um 700 Prozent erhöht.

Die globale Netzwerkinfrastruktur ist zum Teil außerordentlich anfällig. Beispielsweise können Glasfaserkabel von über den Meeresgrund gezogenen Schleppankern durchtrennt werden. So wurden beispielsweise Internetkabel nach Jersey durch einen Schiffsanker zerstört. Damit wir unsere Cloudanforderungen verlässlich erfüllen können, verfügen wir über eine große Zahl physischer Netzwerkpfade mit automatischem Routing zur Fehlerumgehung, um maximale Zuverlässigkeit zu gewährleisten.

Backbone zwischen Rechenzentren

Abbildung 3: Der Backbone verbindet Rechenzentren global mit Glasfaserkabeln

Betriebssteuerung und Datenverkehrsverwaltung mit Software

Die Bereitstellung von Datenverkehr für Millionen physischer Server, deren Zahl weiterhin zunimmt, ist mit Technologien aus der Zeit vor der Cloud nicht möglich. In Zusammenarbeit mit Microsoft Research haben wir eine Reihe von SDN-Technologien entwickelt, um das Routing optimal zu verwalten und die Steuerung zu zentralisieren und so die für das Gesamtnetzwerk gesteckten Ziele umzusetzen. Wir verwenden konventionelle Switches und Router, verwalten diese jedoch mit unserer eigenen Software, die speziell zur Bewältigung des enormen Datenverkehrsvolumens im Microsoft-Netzwerk entwickelt wurde.

Zum Verwalten unseres WAN nutzen wir eine SDN-basierte Architektur namens SWAN. Diese erlaubt zentralisierte Verwaltung und Steuerung der Netzwerkinfrastruktur und verbessert Zuverlässigkeit und Effizienz. Mit SWAN wird gesteuert, wann der jeweilige Dienst wie viel Datenverkehr sendet, und die Datenebene des Netzwerks bei Bedarf abhängig von den jeweiligen Datenverkehrsanforderungen automatisch umkonfiguriert. Mit SWAN steuern wir den gesamten Netzwerkfluss – von den entlegensten Rändern unseres Netzwerks über unser globales WAN bis hin zur Netzwerkschnittstellenkarte auf einem Server in einem unserer Rechenzentren.

Zusammenfassung

Ganz gleich, ob Sie sich dafür entscheiden, über das Internet oder ein privates Netzwerk die Microsoft Cloud zu erreichen – wir sind bestrebt, das schnellste und zuverlässigste globale Netzwerk aufzubauen, das eine öffentliche Cloud bieten kann. Wir lassen Innovation und Investitionen auch künftig in eine global verteilte Netzwerkplattform einfließen, um hohe Leistung, niedrige Latenz und die zuverlässigste Cloud der Welt zu realisieren. Wir bieten Ihnen auch in Zukunft die beste aller möglichen Netzwerkerfahrungen – an jedem Ort der Welt.

Weitere Informationen

Weitere Beiträge aus dieser Reihe finden Sie unter: