Omitir navegación

Confiabilidad de Azure

Obtenga las herramientas y el aprendizaje que necesita para diseñar y operar sistemas críticos con confianza

La confiabilidad es una responsabilidad compartida

Consiga los objetivos de confiabilidad de su organización para todas las cargas de trabajo, empezando por una base resistente como la que ofrece la plataforma en la nube Azure. Diseñe y opere sus aplicaciones críticas con confianza, sabiendo que puede confiar en la nube, porque Azure da prioridad a la transparencia y lo mantiene siempre informado para que pueda tomar medidas rápidamente cuando se producen problemas en los servicios.

Si desea optimizar en Azure una aplicación que utiliza actualmente, comience con el Marco de buena arquitectura de Azure, un conjunto de principios rectores que abarcan cinco pilares principales: la confiabilidad, la seguridad, la eficiencia del rendimiento, la optimización de costos y la excelencia operativa.

Comience con una base confiable en la infraestructura de Azure

Conozca la inversión constante que realiza Microsoft para mantener y mejorar la confiabilidad de la plataforma en la nube con la serie de entradas de blog sobre la confiabilidad avanzada del director de tecnología y miembro del equipo técnico de Azure, Mark Russinovich. La serie incluye estos cuatro temas recientes: confiabilidad de la red mediante el uso de software inteligente, desarrollo seguro con AIOps (presentación sobre Gandalf), modelado de amenazas de resistencia para sistemas distribuidos de gran tamaño y mantenimiento con bajo o ningún impacto.

La red de Microsoft conecta más de 60 regiones de Azure, 220 centros de datos de Azure, 170 sitios perimetrales y más de 265 500 km de cable de fibra terrestre y submarino en todo el mundo, que conecta con el resto de Internet en puntos de presencia perimetrales estratégicos en todo el planeta. Encontrará más información sobre la confiabilidad de la red de Microsoft en esta entrada de blog de dos partes.

La supervisión continua de las métricas de mantenimiento es una parte fundamental del proceso de implementación y aquí es donde AIOps desempeña un papel fundamental. Descubra en esta entrada de blog cómo se usan la inteligencia artificial y el aprendizaje automático para capacitar a los ingenieros de DevOps, supervisar el proceso de implementación de Azure a gran escala, detectar problemas con anticipación y tomar decisiones de lanzamiento o reversión en función de la gravedad y el ámbito de impacto.

Descubra cómo los equipos de ingeniería de servicios de Azure usan los "análisis finales" como una herramienta para comprender mejor lo que salió mal, por qué salió mal y el impacto de las interrupciones en el cliente, y obtenga información sobre los procesos de modelado de amenazas de resistencia y análisis finales.

Conozca las tecnologías de actualización con poco o ningún impacto, como la aplicación de revisiones en caliente, el mantenimiento de conservación de la memoria y la migración en vivo, que usan Azure para mantener su infraestructura con poco o ningún impacto en el cliente ni en el tiempo de inactividad.

Elija las funcionalidades adecuadas de resistencia de Azure para sus necesidades

Descubra qué funcionalidades de alta disponibilidad, recuperación ante desastres y copia de seguridad de Azure usar con sus aplicaciones. Además, obtenga información sobre cómo seleccionar las opciones de proceso, almacenamiento y redundancia geográfica (local, zonal y regional) más convenientes.

Habilite resistencia integrada

Aproveche los servicios y características opcionales de Azure para lograr sus objetivos de confiabilidad específicos.

Zonas de disponibilidad

Ejecute cargas de trabajo críticas en los centros de datos con alimentación, refrigeración y redes independientes.

Conjuntos de disponibilidad

Consiga redundancia dentro de un centro de datos mediante la colocación o separación de los recursos.

Azure Traffic Manager

Implemente la conmutación automática por error, optimice el tráfico y combine sistemas locales y en la nube.

Azure Site Recovery

Replique cargas de trabajo locales y de Azure desde un sitio primario a una ubicación secundaria.

Azure Backup

Realice copias de seguridad de los datos con una solución de recuperación y restauración sencilla, segura y rentable.

Azure Storage

Cree y almacene varias copias de los datos con opciones de redundancia para cualquier escenario.

Supervise su nube para que no sea opaca

Asegure la confiabilidad a largo plazo con herramientas de supervisión para identificar, diagnosticar y supervisar anomalías, y optimice la confiabilidad y el rendimiento.

Azure Chaos Studio

Mejore sistemáticamente la resistencia con un caos controlado.

Azure Service Health

Identifique problemas de los recursos y resuélvalos con un panel personalizable.

Azure Monitor

Recopile y analice los datos de telemetría de sus entornos de Azure y locales y actúe sobre dichos datos.

Azure Application Insights

Obtenga información inteligente sobre el uso de las aplicaciones y diagnostique anomalías.

Network Watcher

Supervise, diagnostique y obtenga información sobre el rendimiento y el estado de la red.

Azure Advisor

Optimice la confiabilidad de las aplicaciones y los sistemas con recomendaciones basadas en la telemetría de uso.

Confiabilidad por la que apuestan organizaciones de todos los tamaños

ClearBank crea resistencia de la infraestructura, confianza del cliente y valor competitivo

"Ensuring end-to-end reliability and resiliency is a team effort. We get the tools from Azure, and we set up the systems and processes to put it all together."

Tom Harris, director de tecnología, ClearBank
ClearBank

Kodak Alaris impulsa la productividad al mejorar la resistencia de ERP

"The one thing I don't want is my CIO coming to me because there's a problem with our ERP. The truth is, it never happens anymore—it's a real testament to our ERP's reliability in Azure."

– Joseph Calabrese, director de operaciones de TI, Kodak Alaris
Kodak Alaris

El aeropuerto más grande de Serbia ejecuta un gran volumen de recuperación automatizada

"We wanted a business continuity plan for recovery for the business systems we need to run the airport, but without the expense of commissioning and maintaining secondary infrastructure. We also wanted to ensure recovery is fast and automated in the event of any failure."

– Marko Marković, director del departamento de TI, AD Aerodrom Nikola Tesla Beograd
AD Aerodrom Nikola Tesla Beograd

Maria Curie proporciona servicios más estables y confiables

"In the last two and a half years, we've had one outage which has been due to cloud infrastructure failing. It just almost instantly gave us stability, space to breathe, enabled us to focus on bringing real value to the organization."

Ivan Delany, director de TI, Marie Curie
Marie Curie

Juvare impulsa la confiabilidad y la integridad de su plataforma de incidentes

"We architected our solution to spread workloads across different availability zones and regions, to maintain both client requirements for geographic data residency but also to ensure that if one particular part of our infrastructure was having a problem, it reduced the blast radius."

Bryan Kaplan, director de información, Juvare
Juvare

GEP mejoró la confiabilidad de su plataforma logística

"We use AKS or Azure Kubernetes Service inbuilt node pools...say your primary node pool is down, within the cluster you're automatically able to failover to the second availability zone."

Nithin Prasad, jefe de ingeniería, GEP
gep

Documentación, entrenamiento y recursos

Microsoft Learn

Adquiera nuevas aptitudes para ayudarlo a mejorar la confiabilidad de sus aplicaciones y sistemas con estos módulos de Microsoft Learn gratuitos:

Ingeniería de confiabilidad de sitios (SRE)

Aprenda a usar SRE, una disciplina que ayuda a las organizaciones a lograr el nivel de confiabilidad adecuado en sus sistemas, servicios y productos:

Obtenga más información sobre el diseño para lograr confiabilidad, uno de los cinco pilares de la excelencia de la arquitectura del marco de buena arquitectura de Azure