Processo di rilevamento anomalie

Azure Databricks

Bus di servizio di Azure

Account di archiviazione di Azure

Questo articolo presenta un'architettura per un'implementazione quasi in tempo reale di un processo di rilevamento anomalie.

Architettura

Diagramma dell'architettura del processo di rilevamento anomalie.

Scaricare un file di Visio di questa architettura.

Flusso di dati

I dati delle serie temporali possono provenire da più origini, ad esempio Database di Azure per MySQL, archiviazione BLOB, Hub eventi, Azure Cosmos DB, database SQL e Database di Azure per PostgreSQL.
I dati vengono inseriti nel calcolo da varie origini di archiviazione da monitorare da Rilevamento anomalie.
Databricks consente di aggregare, campionare e calcolare i dati non elaborati per generare il tempo con i risultati rilevati. Databricks è in grado di elaborare flussi e dati statici. L'analisi di flusso e Azure Synapse possono essere alternative in base ai requisiti.
L'API rilevamento anomalie rileva le anomalie e restituisce i risultati da calcolare.
I metadati correlati alle anomalie vengono accodati.
Application Insights seleziona il messaggio dalla coda dei messaggi in base ai metadati correlati alle anomalie e invia un avviso relativo all'anomalia.
I risultati vengono archiviati in Azure Data Lake Service Gen2.
Le applicazioni Web e Power BI possono visualizzare i risultati del rilevamento anomalie.

Componenti

Tecnologie chiave usate per implementare questa architettura:

bus di servizio: messaggistica cloud affidabile come servizio (MaaS) e integrazione ibrida semplice.
Azure Databricks: servizio di analisi rapido, semplice e collaborativo basato su Apache Spark.
Power BI: strumenti bi per la visualizzazione interattiva dei dati.
Archiviazione Account: archiviazione cloud durevole, a disponibilità elevata e altamente scalabile.
Servizi cognitivi: servizi basati sul cloud con API REST e SDK della libreria client disponibili per facilitare la creazione di intelligenza cognitiva nelle applicazioni.
App per la logica: piattaforma serverless per la creazione di flussi di lavoro aziendali che integrano applicazioni, dati e servizi. In questa architettura le app per la logica sono attivate da richieste HTTP.
Azure Data Lake Archiviazione Gen2: Azure Data Lake Archiviazione Gen2 offre semantica del file system, sicurezza a livello di file e scalabilità.
Application Insights: Application Insights è una funzionalità di Monitoraggio di Azure che fornisce la gestione estendibile delle prestazioni delle applicazioni (APM) e il monitoraggio per le app Web attive.

Alternative

Hub eventi con Kafka: alternativa all'esecuzione del proprio cluster Kafka. Questa funzionalità di Hub eventi fornisce un endpoint compatibile con le API Kafka.
Azure Synapse Analytics: un servizio di analisi che riunisce il data warehousing aziendale e l'analisi dei Big Data.
Azure Machine Learning: creare, eseguire il training, distribuire e gestire modelli di rilevamento anomalie/Machine Learning personalizzati in un ambiente basato sul cloud.

Dettagli dello scenario

L'API Servizi cognitivi di Azure Rilevamento anomalie consente di monitorare e rilevare anomalie nei dati delle serie temporali senza dover conoscere l'apprendimento automatico. Gli algoritmi dell'API si adattano identificando e applicando automaticamente i modelli più adatti ai dati delle serie temporali, indipendentemente dal settore, dallo scenario o dal volume di dati. Determinano i limiti per il rilevamento anomalie, i valori previsti e i punti dati anomali.

Potenziali casi d'uso

Alcune aree di rilevamento anomalie consentono di monitorare:

Frode bancaria (settore finanziario)
Difetti strutturali (industria manifatturiera)
Problemi medici (settore sanitario)

Considerazioni

Queste considerazioni implementano i pilastri di Azure Well-Architected Framework, che è un set di set di principi guida che possono essere usati per migliorare la qualità di un carico di lavoro. Per altre informazioni, vedere Framework ben progettato di Microsoft Azure.

Scalabilità

La maggior parte dei componenti usati in questo scenario è costituita da servizi gestiti con scalabilità automatica.

Per indicazioni generali sulla progettazione di soluzioni scalabili, vedere l'elenco di controllo per l'efficienza delle prestazioni nel Centro architetture di Azure.

Sicurezza

La sicurezza offre garanzie contro attacchi intenzionali e l'abuso di dati e sistemi preziosi. Per altre informazioni, vedere Panoramica del pilastro della sicurezza.

Identità gestite per le risorse di Azure vengono usate per offrire l'accesso ad altre risorse interne all'account e quindi assegnate a Funzioni di Azure. Consentire a tali identità di accedere solo alle risorse necessarie per garantire che nessun elemento aggiuntivo venga esposto alle funzioni e potenzialmente ai clienti.

Per indicazioni generali sulla progettazione di soluzioni sicure, vedere la documentazione sulla sicurezza di Azure.

Resilienza

Tutti i componenti in questo scenario vengono gestiti, quindi a livello di area sono tutti resilienti automaticamente.

Per indicazioni generali sulla progettazione di soluzioni resilienti, vedere Progettazione di applicazioni resilienti per Azure.

Ottimizzazione dei costi

L'ottimizzazione dei costi riguarda l'analisi dei modi per ridurre le spese non necessarie e migliorare l'efficienza operativa. Per altre informazioni, vedere Panoramica del pilastro di ottimizzazione dei costi.

Per esplorare il costo di esecuzione di questo scenario, vedere la calcolatrice precompilato con tutti i servizi. Per vedere come cambiano i prezzi per un caso d'uso specifico, modificare le variabili appropriate in modo che corrispondano ai volumi di traffico/dati previsti.

Sono stati forniti tre profili di costo di esempio in base alla quantità di traffico (si presuppone che tutte le immagini siano di 100 kb di dimensioni):

Calcolatore di esempio: questo esempio di prezzi è un calcolatore con tutti i servizi in questa architettura, ad eccezione di Power BI e della soluzione di avviso personalizzata.

Collaboratori

Questo articolo viene gestito da Microsoft. Originariamente è stato scritto dai seguenti contributori.

Autore principale:

Ashish Chauhan | Senior Cloud Solution Architect

Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.

Processo di rilevamento anomalie

Architettura

Flusso di dati

Componenti

Alternative

Dettagli dello scenario

Potenziali casi d'uso

Considerazioni

Scalabilità

Sicurezza

Resilienza

Ottimizzazione dei costi

Collaboratori

Passaggi successivi

Commenti e suggerimenti

Commenti e suggerimenti

Risorse aggiuntive

Processo di rilevamento anomalie

Architettura

Flusso di dati

Componenti

Alternative

Dettagli dello scenario

Potenziali casi d'uso

Considerazioni

Scalabilità

Sicurezza

Resilienza

Ottimizzazione dei costi

Collaboratori

Passaggi successivi

Risorse correlate

Commenti e suggerimenti

Commenti e suggerimenti

Risorse aggiuntive