Detección de anomalías en flujos de datos en tiempo real

La solución para el conocimiento de anomalías de TI de Cortana Intelligence ayuda a los departamentos de TI de las grandes organizaciones a detectar y corregir problemas con rapidez usando métricas subyacentes del estado de mantenimiento de la infraestructura de TI (CPU, memoria, etc.), los servicios (agotamiento de tiempos de espera, variaciones en los acuerdos de nivel de servicio, caídas de tensión, etc.) y otros indicadores clave de rendimiento (KPI) (pedidos pendientes, errores de inicio de sesión y pagos, etc.) de un modo automatizado y escalable. Esta solución ofrece también una sencilla experiencia “Probarlo ahora” en la que se pueden usar datos personalizados para descubrir el valor que ofrece la solución. La experiencia “Implementar” permite comenzar a usar rápido la solución en Azure porque se implementan todos los componentes de la solución en su suscripción de Azure y se le concede control total para personalizarla como sea necesario.

Descripción

Nota: Si ya ha implementado esta solución, haga clic aquí para ver la implementación.

Póngase en contacto con alguno de nuestros asociados de análisis avanzado para organizar una prueba de concepto en su entorno: Neal Analytics, Empired

Tiempo de aprovisionamiento estimado: 30 minutos

Los servicios modernos de hoy día generan grandes volúmenes de datos de telemetría para hacer el seguimiento de diversos aspectos del estado de las operaciones, el rendimiento del sistema, la información de uso, métricas empresariales, alertas, etc. Sin embargo, es frecuente que la supervisión y la obtención de conocimiento de este gran volumen de datos para los departamentos de TI no estén totalmente automatizadas y sean propensas a errores (generalmente con el uso de alertas basadas en umbrales o reglas), lo que dificulta una determinación precisa y eficaz del estado de mantenimiento del sistema en cualquier momento.

La solución para el conocimiento de anomalías de TI de Cortana Intelligence le evita esta pesadilla a los clientes porque proporciona una solución sencilla basada en soluciones de Cortana Intelligence (para facilitar la implementación en servicios de Azure) y Anomaly Detection API de Azure Machine Learning (para disponer de seguimiento totalmente automatizado de los datos históricos y en tiempo real), lo que facilita a los usuarios profesionales encargados de tomar decisiones la evaluación y el conocimiento del valor en cuestión de minutos. Además, permite a los clientes usar sus propios datos, personalizar y ampliar la solución para adaptarla a sus circunstancias específicas mediante pruebas de concepto rápidas. Con esta solución, las organizaciones pueden hacer lo siguiente:

  • Aprovechar la API vanguardista Anomaly Detection API de Azure Machine Learning para detectar anomalías en datos históricos y en tiempo real y tomar medidas al respecto. Esto elimina la intervención humana que, de otro modo, sería necesaria para recalibrar los umbrales con el fin de detectar anomalías que se han pasado por alto y minimizar los falsos positivos.
  • Darse cuenta rápidamente del potencial de la solución porque pueden probarla con sus propios datos sin necesidad de hacer ninguna inversión inicial. La experiencia “Probarlo ahora” proporciona también a los usuarios la capacidad de determinar el conjunto correcto de parámetros de sensibilidad para el caso de uso en cuestión.
  • Implementar una canalización completa en su suscripción para ingerir datos de orígenes del entorno local y de la nube y notificar eventos anómalos a sistemas de supervisión de bajada y registro de incidencias al estilo “plug-and-play” en cuestión de minutos.

Experiencia “Probarlo” con PowerBI

Panel de la solución preconfigurada para el conocimiento de anomalías de TI

Diagrama de la solución

Vea la arquitectura de la solución y obtenga instrucciones detalladas en GitHub.

Como se explica en el siguiente diagrama de la solución, se pueden bombear flujos de datos de métricas en tiempo real procedentes de sistemas locales o en la nube a la cola de Azure Event Hubs. Estos eventos (o puntos de datos de una serie temporal) se procesan en Azure Stream Analytics, donde se agregan cada cinco minutos. Cada serie temporal se envía a Azure Anomaly Detection API para evaluarla cada 15 minutos. Los resultados de la API, junto con las dimensiones proporcionadas durante la entrada de datos, se almacenan después en Azure SQL Database. Las anomalías detectadas se publican también en Azure Service Bus para que las puedan consumir los sistemas de registro de incidencias de bajada. La solución proporciona también indicaciones para configurar un panel de Power BI con el fin de visualizar las anomalías con rapidez y llevar a cabo un análisis de la causa principal.

Anomaly Detection API

Anomaly Detection API se utiliza en la experiencia “Probarlo ahora” y en la solución implementada. Ayuda a detectar diferentes tipos de patrones de anomalías en datos de series temporales. Asigna una puntuación de anomalía a cada punto de datos de la serie temporal, que se puede usar para la generación de alertas, la supervisión mediante paneles o la conexión con sistemas de registro de incidencias. Anomaly detection API puede detectar los siguientes tipos de anomalías en datos de series temporales:

  • Picos y valles: por ejemplo, cuando se supervisa el número de errores de inicio de sesión en un servicio o el número de finalizaciones de compra en un sitio de comercio electrónico, los picos o valles inusuales podrían indicar ataques de seguridad o interrupciones del servicio.
  • Tendencias positivas y negativas: cuando se supervisa el uso de memoria en informática, por ejemplo, la disminución de la memoria disponible puede indicar una posible fuga de memoria; cuando se supervisa la longitud de la cola de un servicio, una tendencia persistente al alza puede indicar un problema de software subyacente.
  • Cambios de nivel y en el intervalo dinámico de los valores: por ejemplo, puede ser interesante supervisar los cambios de nivel en la latencia de un servicio después de actualizarlo o niveles inferiores de excepciones después de la actualización.

Declinación de responsabilidades

©2017 Microsoft Corporation. Todos los derechos reservados. Esta información se proporciona "tal cual" y puede cambiar sin previo aviso. Microsoft no ofrece ninguna garantía, ni expresa ni implícita, respecto a la información que aquí se proporciona. Para generar la solución, se utilizaron datos de terceros. Usted es responsable de respetar los derechos de otros, incluida la adquisición y el cumplimiento de las licencias correspondientes para crear conjuntos de datos similares.

Arquitecturas de soluciones relacionadas

Mantenimiento predictivo

Esta solución de mantenimiento predictivo supervisa los aviones y predice la vida útil restante de los componentes del motor.

Control de calidad

Los sistemas de control de calidad permiten a las empresas evitar defectos en sus procesos de entrega de productos o servicios a los clientes. La creación de un sistema de este tipo que recopile datos e identifique posibles problemas en una canalización puede suponer una gran ventaja. Por ejemplo, en la fabricación digital, el control de la calidad en la cadena de montaje es imprescindible. Identificar ralentizaciones y posibles errores antes de que ocurran (no después de detectarlos) puede ayudar a las empresas a reducir los costos que suponen el desperdicio y la reelaboración de los productos, al tiempo que aumenta la productividad.