Zuverlässigkeit in Azure

Tools und Schulungsangebote für die sichere Entwicklung und Ausführung unternehmenskritischer Systeme

Zuverlässigkeit als gemeinsame Verantwortung

Nutzen Sie die Azure-Cloudplattform als resilientes Fundament, um die Zuverlässigkeitsziele Ihres Unternehmens für alle Ihre Workloads zu erreichen. Entwickeln und nutzen Sie unternehmenskritische Anwendungen mit der Gewissheit, dass Sie Ihrer Cloud vertrauen können. Bei Azure steht Transparenz im Vordergrund, sodass Sie stets informiert bleiben und schnell auf Dienstprobleme reagieren können.
Wenn Sie eine vorhandene Anwendung in Azure optimieren möchten, beginnen Sie mit dem Azure Well-Architected Framework. Darin finden Sie Leitprinzipien für die fünf wichtigsten Säulen: Zuverlässigkeit, Sicherheit, Leistungseffizienz, Kostenoptimierung und optimaler Betrieb.

Ein Diagramm, das zeigt, wie die Zuverlässigkeit der Azure-Cloud-Plattform und die bedarfsgerechte Nutzung von Resilienzfunktionen zu äußerst zuverlässigen, resilienten Apps führen

Eine zuverlässige Grundlage für Azure-Infrastrukturen

Informieren Sie sich über laufende Microsoft-Investitionen zur Erhaltung und Verbesserung der zuverlässigen Cloudplattform. Die Blogreihe zur Steigerung der Zuverlässigkeit von Azure CTO und Technical Fellow Mark Russinovich behandelt u. a. die folgenden vier aktuellen Themen: Netzwerkzuverlässigkeit durch intelligente Software, sichere Entwicklung mit AIOps (Einführung von Gandalf), Modellierung von Resilienzbedrohungen für große verteilte Systeme sowie Wartung mit geringfügigen oder ohne Unterbrechungen.

Netzwerkzuverlässigkeit durch intelligente Software Sichere Bereitstellung mit AIOps: Einführung von Gandalf Modellierung von Resilienzbedrohungen für große verteilte Systeme Wartung mit geringfügigen oder ohne Unterbrechungen

Das Microsoft-Netzwerk verbindet mehr als 60 Azure-Regionen, über 300 Azure-Rechenzentren, 190 Edge-Standorte und mehr als 175 000 Meilen terrestrische und unterseeische Glasfaserkabel weltweit.

Die kontinuierliche Überwachung von Integritätsmetriken ist ein grundlegender Bestandteil des Bereitstellungsprozesses, bei dem AIOps eine wichtige Rolle spielen. Erfahren Sie in diesem Blogbeitrag, wie KI und Machine Learning technische Fachkräfte für DevOps unterstützen, den Azure-Bereitstellungsprozess umfassend überwachen, Probleme frühzeitig erkennen und basierend auf dem Wirkungsumfang und Schweregrad Entscheidungen zum Rollout oder Rollback treffen.

Erfahren Sie, wie Azure Service Engineering-Teams mithilfe von „Postmortems“ analysieren, was schiefgelaufen ist, wie es zu einem Fehler kam und welche Auswirkungen solche Ausfälle auf Kunden haben. Außerdem erhalten Sie Einblicke in die Prozesse zur Modellierung von Postmortems und Resilienzbedrohungen.

Erfahren Sie mehr über Updatetechnologien, die keine oder nur geringe Auswirkungen haben, wie Hotpatching, arbeitsspeichererhaltende Wartung und Livemigration. Azure setzt diese Technologien zur Wartung der Infrastruktur ein, um Auswirkungen oder Ausfallzeiten für Kunden zu minimieren oder ganz zu vermeiden.

Wählen Sie die geeigneten Azure-Resilienzfunktionen für Ihre Anforderungen

Erfahren Sie, welche Azure-Features für Hochverfügbarkeit, Notfallwiederherstellung und Sicherung Sie für Ihre Apps verwenden können. Außerdem lernen Sie die für Sie geeigneten Redundanzoptionen für Compute-, Speicher- und geografische Faktoren (lokal, zonal und regional) kennen.

PDF herunterladen

Eine PDF-Infografik, die zeigt, welche unterschiedlichen Resilienzfunktionen die verschiedenen Azure-Dienste bieten

Integrierte Resilienz nutzen

Nutzen Sie optionale Azure-Dienste und -Features, um Ihre individuellen Zuverlässigkeitsziele zu erreichen.

Verfügbarkeitszonen

Rechenzentrumsübergreifende Ausführung kritischer Workloads mit unabhängiger Leistung, Kühlung und Netztechnologie

Verfügbarkeitsgruppen

Redundanz innerhalb eines Rechenzentrums durch die Zusammenlegung oder Trennung von Ressourcen

Azure Traffic Manager

Automatisches Failover, optimierter Datenverkehr und Kombination lokaler und cloudbasierter Systeme

Azure Site Recovery

Replikation von lokalen Workloads und Azure-Workloads von einem primären an einen sekundären Standort

Azure Backup

Datensicherung mit einer einfachen, sicheren und kosteneffizienten Wiederherstellungslösung

Azure Storage

Anlegen und Speichern mehrerer Datenkopien durch Redundanzoptionen für jedes Szenario

Cloud überwachen und Blackboxverhalten vermeiden

Erzielen Sie langfristige Zuverlässigkeit mit Überwachungstools für die Ermittlung, Diagnose und Nachverfolgung von Anomalien, und optimieren Sie Ihre Zuverlässigkeit und Leistung.

Azure Chaos Studio

Systematische Resilienzsteigerung durch „kontrolliertes Chaos“

Azure Service Health

Ermitteln und Beheben von Ressourcenproblemen mithilfe eines anpassbaren Dashboards

Azure Monitor

Erfassen, Analysieren und Nutzen von Telemetriedaten aus Azure- und lokalen Umgebungen

Azure Application Insights

Intelligente Einblicke in die App-Nutzung und Diagnose von Anomalien

Network Watcher

Überwachen, Diagnostizieren und Gewinnen von Einblicken in Netzwerkleistung und -status

Azure Advisor

Optimierte Zuverlässigkeit für Apps und Systeme durch Empfehlungen auf der Basis von Nutzungstelemetriedaten

Unternehmen jeder Größe vertrauen auf Azure

ClearBank bietet Infrastrukturresilienz, Kundenvertrauen und Wettbewerbsvorteile

"Durchgängige Zuverlässigkeit und Resilienz sind eine Teamleistung. Mit den Azure-Tools implementieren wir Systeme und Prozesse, um alles zusammenzuführen."

Tom Harris, Chief Technology Officer, ClearBank

Kundenreferenz lesen

Die University of Miami fördert die Zuverlässigkeit mit Microsoft Azure

"Bei jeder Lösung fragen wir uns, wie wir sie in der Cloud statt lokal umsetzen können. So steigern wir nicht nur unsere Resilienz, sondern werden auch flexibler und agiler."

Mari Lovo, Director, IT, Cloud Infrastructure Services, University of Miami

Kundenreferenz lesen

Marie Curie bietet stabilere Reliable Services

"In den letzten zweieinhalb Jahren hatten wir nur einen einzigen Ausfall, der auf eine Störung der Cloudinfrastruktur zurückzuführen war. Durch Azure gewannen wir sofort Stabilität und Zeit, um eine echte Wertschöpfung für das Unternehmen zu erzielen."

Ivan Delany, IT Director, Marie Curie

Video ansehen

Juvare steigert die Zuverlässigkeit und Integrität der eigenen Incidentplattform

"Mit unserer Lösung wollten wir Workloads auf verschiedene Verfügbarkeitszonen und Regionen verteilen, um sowohl Kundenanforderungen an die geografische Datenresidenz zu erfüllen als auch sicherzustellen, dass die Reichweite eines Problems innerhalb eines bestimmten Teils unserer Infrastruktur reduziert wird."

Bryan Kaplan, Chief Information Officer, Juvare

Video ansehen

GEP verbessert die Zuverlässigkeit seiner Logistikplattform

"Wir nutzen die in AKS oder Azure Kubernetes Service integrierten Knotenpools. Wenn der primäre Knotenpool ausfällt, kann innerhalb des Clusters automatisch ein Failover auf die zweite Verfügbarkeitszone erfolgen."

Nithin Prasad, Principal Engineer, GEP

Video ansehen

Dokumentation, Schulungen und Ressourcen

Azure Architecture Center

Setzen Sie bei der Entwicklung zuverlässiger Lösungen auf bewährte Muster und Methoden:

Azure Well-Architected Framework Azure Well-Architected-Bewertung Leitfaden zur Azure-Anwendungsarchitektur Cloudentwurfsmuster

Microsoft Learn

Erwerben Sie mithilfe dieser kostenlosen Microsoft Learn-Module neue Kenntnisse, um besonders zuverlässige Apps und Systeme zu entwickeln:

Entwickeln herausragender Lösungen mit dem Microsoft Azure Well-Architected Framework Architektur für die Migration, Geschäftskontinuität und Notfallwiederherstellung in Azure Überwachen und Sichern von Azure-Ressourcen

Sitezuverlässigkeits-Entwicklung (Site Reliability Engineering, SRE)

Machen Sie sich mit der praktischen Anwendung der SRE-Methode vertraut, mit der Unternehmen die nötige Zuverlässigkeit für Systeme, Dienste und Produkte erzielen:

Dokumentation zu SRE Video: Einführung in Sitezuverlässigkeits-Entwicklung (Site Reliability Engineering, SRE) Lernmodul: Einführung in Sitezuverlässigkeits-Entwicklung (Site Reliability Engineering, SRE)

Erfahren Sie, wie Sie Ihre Architektur auf Zuverlässigkeit ausrichten, eine der fünf Säulen im Azure Well-Architected Framework.

Mehr erfahren