Zuverlässigkeit in Azure
Tools und Schulungsangebote für die sichere Entwicklung und Ausführung unternehmenskritischer Systeme
Zuverlässigkeit als gemeinsame Verantwortung
Nutzen Sie die Azure-Cloudplattform als resilientes Fundament, um die Zuverlässigkeitsziele Ihres Unternehmens für alle Ihre Workloads zu erreichen. Entwickeln und nutzen Sie unternehmenskritische Anwendungen mit der Gewissheit, dass Sie Ihrer Cloud vertrauen können. Bei Azure steht Transparenz im Vordergrund, sodass Sie stets informiert bleiben und schnell auf Dienstprobleme reagieren können.
Wenn Sie eine vorhandene Anwendung in Azure optimieren möchten, beginnen Sie mit dem Azure Well-Architected Framework. Darin finden Sie Leitprinzipien für die fünf wichtigsten Säulen: Zuverlässigkeit, Sicherheit, Leistungseffizienz, Kostenoptimierung und optimaler Betrieb.
Eine zuverlässige Grundlage für Azure-Infrastrukturen
Informieren Sie sich über laufende Microsoft-Investitionen zur Erhaltung und Verbesserung der zuverlässigen Cloudplattform. Die Blogreihe zur Steigerung der Zuverlässigkeit von Azure CTO und Technical Fellow Mark Russinovich behandelt u. a. die folgenden vier aktuellen Themen: Netzwerkzuverlässigkeit durch intelligente Software, sichere Entwicklung mit AIOps (Einführung von Gandalf), Modellierung von Resilienzbedrohungen für große verteilte Systeme sowie Wartung mit geringfügigen oder ohne Unterbrechungen.
Das Microsoft Network verbindet mehr als 60 Azure-Regionen, 200 Azure-Rechenzentren, 190 Edgestandorte und über 280.000 Kilometer Glasfaserleitungen (im Boden und Meer), durch die über strategische globale Edge Points of Presence eine Verbindung mit dem übrigen Internet hergestellt wird. Erfahren Sie in diesem zweiteiligen Blogbeitrag mehr über die Zuverlässigkeit von Microsoft Network.
Die kontinuierliche Überwachung von Integritätsmetriken ist ein grundlegender Bestandteil des Bereitstellungsprozesses, bei dem AIOps eine wichtige Rolle spielen. Erfahren Sie in diesem Blogbeitrag, wie KI und Machine Learning technische Fachkräfte für DevOps unterstützen, den Azure-Bereitstellungsprozess umfassend überwachen, Probleme frühzeitig erkennen und basierend auf dem Wirkungsumfang und Schweregrad Entscheidungen zum Rollout oder Rollback treffen.
Erfahren Sie, wie Azure Service Engineering-Teams mithilfe von „Postmortems“ analysieren, was schiefgelaufen ist, wie es zu einem Fehler kam und welche Auswirkungen solche Ausfälle auf Kunden haben. Außerdem erhalten Sie Einblicke in die Prozesse zur Modellierung von Postmortems und Resilienzbedrohungen.
Erfahren Sie mehr über Updatetechnologien, die keine oder nur geringe Auswirkungen haben, wie Hotpatching, arbeitsspeichererhaltende Wartung und Livemigration. Azure setzt diese Technologien zur Wartung der Infrastruktur ein, um Auswirkungen oder Ausfallzeiten für Kunden zu minimieren oder ganz zu vermeiden.
Wählen Sie die geeigneten Azure-Resilienzfunktionen für Ihre Anforderungen
Erfahren Sie, welche Azure-Features für Hochverfügbarkeit, Notfallwiederherstellung und Sicherung Sie für Ihre Apps verwenden können. Außerdem lernen Sie die für Sie geeigneten Redundanzoptionen für Compute-, Speicher- und geografische Faktoren (lokal, zonal und regional) kennen.
Integrierte Resilienz nutzen
Nutzen Sie optionale Azure-Dienste und -Features, um Ihre individuellen Zuverlässigkeitsziele zu erreichen.
Verfügbarkeitszonen
Rechenzentrumsübergreifende Ausführung kritischer Workloads mit unabhängiger Leistung, Kühlung und Netztechnologie
Verfügbarkeitsgruppen
Redundanz innerhalb eines Rechenzentrums durch die Zusammenlegung oder Trennung von Ressourcen
Azure Traffic Manager
Automatisches Failover, optimierter Datenverkehr und Kombination lokaler und cloudbasierter Systeme
Azure Site Recovery
Replikation von lokalen Workloads und Azure-Workloads von einem primären an einen sekundären Standort
Azure Backup
Datensicherung mit einer einfachen, sicheren und kosteneffizienten Wiederherstellungslösung
Azure Storage
Anlegen und Speichern mehrerer Datenkopien durch Redundanzoptionen für jedes Szenario
Cloud überwachen und Blackboxverhalten vermeiden
Erzielen Sie langfristige Zuverlässigkeit mit Überwachungstools für die Ermittlung, Diagnose und Nachverfolgung von Anomalien, und optimieren Sie Ihre Zuverlässigkeit und Leistung.
Azure Chaos Studio
Systematische Resilienzsteigerung durch „kontrolliertes Chaos“
Azure Service Health
Ermitteln und Beheben von Ressourcenproblemen mithilfe eines anpassbaren Dashboards
Azure Monitor
Erfassen, Analysieren und Nutzen von Telemetriedaten aus Azure- und lokalen Umgebungen
Azure Application Insights
Intelligente Einblicke in die App-Nutzung und Diagnose von Anomalien
Network Watcher
Überwachen, Diagnostizieren und Gewinnen von Einblicken in Netzwerkleistung und -status
Azure Advisor
Optimierte Zuverlässigkeit für Apps und Systeme durch Empfehlungen auf der Basis von Nutzungstelemetriedaten
Dokumentation, Schulungen und Ressourcen
Azure Architecture Center
Setzen Sie bei der Entwicklung zuverlässiger Lösungen auf bewährte Muster und Methoden:
Microsoft Learn
Erwerben Sie mithilfe dieser kostenlosen Microsoft Learn-Module neue Kenntnisse, um besonders zuverlässige Apps und Systeme zu entwickeln:
Site Reliability Engineering (SRE)
Machen Sie sich mit der praktischen Anwendung der SRE-Methode vertraut, mit der Unternehmen die nötige Zuverlässigkeit für Systeme, Dienste und Produkte erzielen: