Niezawodność platformy Azure
Uzyskaj narzędzia i szkolenia potrzebne do tego, aby bez obaw projektować oraz obsługiwać systemy o znaczeniu krytycznym.
Niezawodność to wspólna odpowiedzialność
Osiągaj cele organizacji w zakresie niezawodności wszystkich obciążeń, zaczynając od odpornego fundamentu platformy Azure w chmurze. Wiedząc, że możesz zaufać swojej chmurze, bez obaw projektuj i obsługuj aplikacje o znaczeniu krytycznym. Platforma Azure priorytetyzuje transparentność — zawsze będziesz otrzymywać bieżące informacje, a dzięki temu szybko zareagujesz w przypadku problemów z usługą.
Jeśli chcesz zoptymalizować istniejącą aplikację na platformie Azure, zacznij od dobrze zaprojektowanej struktury platformy Azure, zestawu przewodnich założeń w zakresie pięciu podstawowych filarów: niezawodności, zabezpieczeń, wydajności, optymalizacji kosztów i doskonałości operacyjnej.
Rozpoczęcie od niezawodnej podstawy w infrastrukturze platformy Azure
Dowiedz się więcej na temat bieżących inwestycji firmy Microsoft w obszarze utrzymania i poprawy niezawodności platformy chmury z serii blogów „Advancing Reliability” (Zwiększanie niezawodności), której autorami są dyrektor ds. technologii platformy Azure i specjalista techniczny Mark Russinovich, w tym zapoznaj się z następującymi czterema ostatnimi tematami: niezawodność sieci dzięki inteligentnemu oprogramowaniu, bezpieczne tworzenie aplikacji za pomocą platformy AIOps — prezentacja usługi Gandalf, modelowanie zagrożeń dotyczących odporności dla dużych systemów rozproszonych oraz konserwacja o niskim wpływie na czas bezawaryjnego działania i bez wpływu na niego.
Sieć firmy Microsoft obejmuje ponad 60 regionów świadczenia platformy Azure, 200 centrów danych platformy Azure, 190 lokacji brzegowych oraz ponad 281 600 kilometrów światłowodów lądowych i podmorskich, które łączą się z pozostałą częścią Internetu w strategicznych brzegowych punktach obecności na całym świecie. Dowiedz się więcej o niezawodności sieci firmy Microsoft z tego dwuczęściowego wpisu w blogu.
Ciągłe monitorowanie metryk kondycji jest podstawową częścią procesu wdrażania, w którym platforma AIOps odgrywa kluczową rolę. W tym wpisie w blogu dowiesz się, jak używać sztucznej inteligencji i uczenia maszynowego, aby zwiększać możliwości inżynierów DevOps, monitorować proces wdrażania platformy Azure na dużą skalę, wcześnie wykrywać problemy oraz podejmować decyzje dotyczące wdrażania lub wycofywania na podstawie zakresu wpływu i poziomu ważności.
Dowiedz się, w jaki sposób zespoły inżynierów usług platformy Azure używają analizy post mortem jako narzędzia do lepszego zrozumienia, co poszło źle, dlaczego poszło źle i jaki jest wpływ awarii na klientów — a także uzyskaj szczegółowe informacje o procesach modelowania analizy post mortem i zagrożeń dotyczących odporności.
Dowiedz się więcej o technologiach aktualizacji z małym lub zerowym wpływem, w tym stosowaniu poprawek na gorąco, konserwacji z zachowaniem pamięci i migracji na żywo, które są używane przez platformę Azure przy konserwacji infrastruktury z małym lub zerowym wpływem na klientów i przestojem.
Wybieranie funkcji odporności platformy Azure odpowiednich dla własnych potrzeb
Dowiedz się, których funkcji wysokiej dostępności, odzyskiwania po awarii i tworzenia kopii zapasowych platformy Azure używać z własnymi aplikacjami. Dowiedz się również, jak wybrać odpowiednie dla siebie środowisko obliczeniowe, magazyn i opcje nadmiarowości geograficznej (lokalnej, strefowej i regionalnej).
Włączanie wbudowanej odporności
Korzystaj z opcjonalnych usług i funkcji platformy Azure, aby osiągnąć swoje cele z zakresu niezawodności.
Strefy dostępności
Uruchamiaj krytyczne obciążenia w centrach danych z niezależnym zasilaniem, chłodzeniem i siecią.
Zestawy dostępności
Zapewnij nadmiarowość w centrum danych przez kolokację lub oddzielenie zasobów.
Azure Traffic Manager
Implementuj automatyczne przełączanie do trybu failover, optymalizuj ruch i łącz systemy lokalne i w chmurze.
Azure Site Recovery
Replikuj obciążenia lokalne i platformy Azure z lokacji głównej do dodatkowej.
Azure Backup
Twórz kopie zapasowe danych za pomocą prostego, bezpiecznego i ekonomicznego rozwiązania do odzyskiwania i przywracania.
Azure Storage
Twórz i zapisuj wiele kopii danych z opcjami nadmiarowości dla każdego scenariusza.
Monitorowanie chmury w taki sposób, aby nie była czarną skrzynką
Zapewnij długoterminową niezawodność dzięki narzędziom do monitorowania, które potrafią identyfikować, diagnozować i śledzić anomalie, a także przeprowadź optymalizację pod kątem niezawodności i wydajności.
Azure Chaos Studio
Systematyczne poprawianie odporności z użyciem kontrolowanego chaosu.
Azure Service Health
Identyfikuj problemy z zasobami i rozwiązuj je przy użyciu dostosowywalnego pulpitu nawigacyjnego.
Azure Monitor
Zbieraj i analizuj dane telemetryczne z platformy Azure i środowisk lokalnych oraz przekształcaj te dane.
Azure Application Insights
Uzyskuj inteligentne analizy użycia aplikacji i diagnozuj anomalie.
Network Watcher
Monitoruj oraz diagnozuj wydajność i kondycję sieci oraz uzyskuj szczegółowe informacje na ten temat.
Azure Advisor
Zoptymalizuj aplikacje i systemy pod kątem niezawodności dzięki rekomendacjom bazującym na danych telemetrycznych użycia.
Dokumentacja, szkolenia i zasoby
Centrum architektury platformy Azure
Twórz niezawodne rozwiązania, stosując się do ustalonych wzorców i najlepszych rozwiązań:
Microsoft Learn
Zyskaj nowe umiejętności, które pomogą Ci uczynić aplikacje i systemy bardziej niezawodnymi dzięki tym bezpłatnym modułom Microsoft Learn:
Inżynieria niezawodności lokacji (SRE, Site Reliability Engineering)
Dowiedz się, jak korzystać z inżynierii niezawodności lokacji, czyli dyscypliny pomagającej organizacjom w osiągnięciu odpowiedniego poziomu niezawodności systemów, usług i produktów: