Questo articolo presenta un'architettura per un'implementazione quasi in tempo reale di un processo di rilevamento anomalie.
Architettura
Scaricare un file di Visio di questa architettura.
Flusso di dati
- I dati delle serie temporali possono provenire da più origini, ad esempio Database di Azure per MySQL, archiviazione BLOB, Hub eventi, Azure Cosmos DB, database SQL e Database di Azure per PostgreSQL.
- I dati vengono inseriti nel calcolo da varie origini di archiviazione da monitorare da Rilevamento anomalie.
- Databricks consente di aggregare, campionare e calcolare i dati non elaborati per generare il tempo con i risultati rilevati. Databricks è in grado di elaborare flussi e dati statici. L'analisi di flusso e Azure Synapse possono essere alternative in base ai requisiti.
- L'API rilevamento anomalie rileva le anomalie e restituisce i risultati da calcolare.
- I metadati correlati alle anomalie vengono accodati.
- Application Insights seleziona il messaggio dalla coda dei messaggi in base ai metadati correlati alle anomalie e invia un avviso relativo all'anomalia.
- I risultati vengono archiviati in Azure Data Lake Service Gen2.
- Le applicazioni Web e Power BI possono visualizzare i risultati del rilevamento anomalie.
Componenti
Tecnologie chiave usate per implementare questa architettura:
- bus di servizio: messaggistica cloud affidabile come servizio (MaaS) e integrazione ibrida semplice.
- Azure Databricks: servizio di analisi rapido, semplice e collaborativo basato su Apache Spark.
- Power BI: strumenti bi per la visualizzazione interattiva dei dati.
- Archiviazione Account: archiviazione cloud durevole, a disponibilità elevata e altamente scalabile.
- Servizi cognitivi: servizi basati sul cloud con API REST e SDK della libreria client disponibili per facilitare la creazione di intelligenza cognitiva nelle applicazioni.
- App per la logica: piattaforma serverless per la creazione di flussi di lavoro aziendali che integrano applicazioni, dati e servizi. In questa architettura le app per la logica sono attivate da richieste HTTP.
- Azure Data Lake Archiviazione Gen2: Azure Data Lake Archiviazione Gen2 offre semantica del file system, sicurezza a livello di file e scalabilità.
- Application Insights: Application Insights è una funzionalità di Monitoraggio di Azure che fornisce la gestione estendibile delle prestazioni delle applicazioni (APM) e il monitoraggio per le app Web attive.
Alternative
- Hub eventi con Kafka: alternativa all'esecuzione del proprio cluster Kafka. Questa funzionalità di Hub eventi fornisce un endpoint compatibile con le API Kafka.
- Azure Synapse Analytics: un servizio di analisi che riunisce il data warehousing aziendale e l'analisi dei Big Data.
- Azure Machine Learning: creare, eseguire il training, distribuire e gestire modelli di rilevamento anomalie/Machine Learning personalizzati in un ambiente basato sul cloud.
Dettagli dello scenario
L'API Servizi cognitivi di Azure Rilevamento anomalie consente di monitorare e rilevare anomalie nei dati delle serie temporali senza dover conoscere l'apprendimento automatico. Gli algoritmi dell'API si adattano identificando e applicando automaticamente i modelli più adatti ai dati delle serie temporali, indipendentemente dal settore, dallo scenario o dal volume di dati. Determinano i limiti per il rilevamento anomalie, i valori previsti e i punti dati anomali.
Potenziali casi d'uso
Alcune aree di rilevamento anomalie consentono di monitorare:
- Frode bancaria (settore finanziario)
- Difetti strutturali (industria manifatturiera)
- Problemi medici (settore sanitario)
Considerazioni
Queste considerazioni implementano i pilastri di Azure Well-Architected Framework, che è un set di set di principi guida che possono essere usati per migliorare la qualità di un carico di lavoro. Per altre informazioni, vedere Framework ben progettato di Microsoft Azure.
Scalabilità
La maggior parte dei componenti usati in questo scenario è costituita da servizi gestiti con scalabilità automatica.
Per indicazioni generali sulla progettazione di soluzioni scalabili, vedere l'elenco di controllo per l'efficienza delle prestazioni nel Centro architetture di Azure.
Sicurezza
La sicurezza offre garanzie contro attacchi intenzionali e l'abuso di dati e sistemi preziosi. Per altre informazioni, vedere Panoramica del pilastro della sicurezza.
Identità gestite per le risorse di Azure vengono usate per offrire l'accesso ad altre risorse interne all'account e quindi assegnate a Funzioni di Azure. Consentire a tali identità di accedere solo alle risorse necessarie per garantire che nessun elemento aggiuntivo venga esposto alle funzioni e potenzialmente ai clienti.
Per indicazioni generali sulla progettazione di soluzioni sicure, vedere la documentazione sulla sicurezza di Azure.
Resilienza
Tutti i componenti in questo scenario vengono gestiti, quindi a livello di area sono tutti resilienti automaticamente.
Per indicazioni generali sulla progettazione di soluzioni resilienti, vedere Progettazione di applicazioni resilienti per Azure.
Ottimizzazione dei costi
L'ottimizzazione dei costi riguarda l'analisi dei modi per ridurre le spese non necessarie e migliorare l'efficienza operativa. Per altre informazioni, vedere Panoramica del pilastro di ottimizzazione dei costi.
Per esplorare il costo di esecuzione di questo scenario, vedere la calcolatrice precompilato con tutti i servizi. Per vedere come cambiano i prezzi per un caso d'uso specifico, modificare le variabili appropriate in modo che corrispondano ai volumi di traffico/dati previsti.
Sono stati forniti tre profili di costo di esempio in base alla quantità di traffico (si presuppone che tutte le immagini siano di 100 kb di dimensioni):
- Calcolatore di esempio: questo esempio di prezzi è un calcolatore con tutti i servizi in questa architettura, ad eccezione di Power BI e della soluzione di avviso personalizzata.
Collaboratori
Questo articolo viene gestito da Microsoft. Originariamente è stato scritto dai seguenti contributori.
Autore principale:
- Ashish Chauhan | Senior Cloud Solution Architect
Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.
Passaggi successivi
- Documentazione dell'API Rilevamento anomalie
- Demo interattiva
- Rilevare e visualizzare le anomalie nei dati con l'API Rilevamento anomalie - Demo in Jupyter Notebook
- Identificare le anomalie instradando i dati tramite hub IoT a un modello di Machine Learning predefinito in Analisi di flusso di Azure
- Ricetta: manutenzione predittiva con Servizi cognitivi per Big Data
- Documentazione sul bus di servizio
- Documentazione di Azure Databricks
- Documentazione di Power BI
- Documentazione di Archiviazione