Analisi in tempo reale sull'architettura dei Big Data

Azure Analysis Services
Hub eventi di Azure
Azure Synapse Analytics

Idee per le soluzioni

Questo articolo è un'idea di soluzione. Per espandere il contenuto con altre informazioni, ad esempio potenziali casi d'uso, servizi alternativi, considerazioni sull'implementazione o indicazioni sui prezzi, inviare commenti e suggerimenti su GitHub.

Questa idea di soluzione descrive come ottenere informazioni dettagliate dai dati di streaming live. Acquisisci continuamente dati da qualsiasi dispositivo IoT o log di clickstream di siti Web ed elaborali in tempo quasi reale.

Architettura

Diagramma di una soluzione di analisi in tempo reale in un'architettura di Big Data che usa Azure Synapse Analytics con Azure Data Lake Archiviazione, Hub eventi, Azure Analysis Services, Azure Cosmos DB e Power BI.

Scaricare un file di Visio di questa architettura.

Flusso di dati

  1. Inserire facilmente dati di streaming live per un'applicazione usando Hub eventi di Azure.
  2. Riunire tutti i dati strutturati usando le pipeline di Synapse per Archiviazione BLOB di Azure.
  3. Sfruttare i vantaggi dei pool di Apache Spark per pulire, trasformare e analizzare i dati di streaming e combinarli con dati strutturati da database operativi o data warehouse.
  4. Usare tecniche di Apprendimento automatico/Deep Learning scalabili per derivare informazioni più approfondite da questi dati, usando Python, Scala o .NET, con esperienze di notebook nei pool di Apache Spark.
  5. Applicare pool di Apache Spark e pipeline di Synapse in Azure Synapse Analytics per accedere e spostare i dati su larga scala.
  6. Creare dashboard di analisi e report incorporati nel pool SQL dedicato per condividere informazioni dettagliate all'interno dell'organizzazione e usare Azure Analysis Services per gestire questi dati a migliaia di utenti.
  7. Esaminare le informazioni dettagliate dai pool di Apache Spark ad Azure Cosmos DB per renderle accessibili tramite app in tempo reale.

Componenti

  • Azure Synapse Analytics è il data warehouse cloud veloce, flessibile e attendibile che consente di ridimensionare, calcolare e archiviare in modo elastico e indipendente, con un'architettura di elaborazione parallela elevata.
  • La documentazione di Synapse Pipelines consente di creare, pianificare e orchestrare i flussi di lavoro ETL/ELT.
  • Azure Data Lake Archiviazione: funzionalità data lake scalabili e sicure di grandi dimensioni basate su Archiviazione BLOB di Azure
  • I pool di Spark di Azure Synapse Analytics sono una piattaforma di analisi rapida, semplice e collaborativa basata su Apache Spark.
  • La documentazione di Azure Hub eventi di Azure è una piattaforma di streaming di Big Data e un servizio di inserimento di eventi.
  • Azure Cosmos DB è un servizio di database multimodello e distribuito a livello globale. Scopri quindi come ottenere informazioni su come replicare i dati in qualsiasi area di Azure e ridimensionare la velocità effettiva indipendentemente dalle risorse di archiviazione.
  • Collegamento ad Azure Synapse per Azure Cosmos DB consente di eseguire analisi near real-time sui dati operativi in Azure Cosmos DB, senza alcun impatto sulle prestazioni o sui costi del carico di lavoro transazionale, usando i due motori di analisi disponibili nell'area di lavoro Azure Synapse: SQL Serverless e Pool di Spark.
  • Azure Analysis Services è un'analisi di livello aziendale distribuita come servizio che consente di gestire, distribuire, testare e distribuire la soluzione BI in tutta sicurezza.
  • Power BI è un gruppo di strumenti di Analisi business che consente di distribuire informazioni dettagliate in tutta l'organizzazione. Connessione a centinaia di origini dati, semplificare la preparazione dei dati e guidare l'analisi non pianificata. Crea report d'impatto e quindi pubblicali per consentire all'organizzazione di utilizzarli sul Web e su dispositivi mobili.

Alternative

  • Collegamento a Synapse è la soluzione preferita da Microsoft per l'analisi sui dati di Azure Cosmos DB.
  • hub IoT di Azure può essere usato invece di Hub eventi di Azure. hub IoT è un servizio gestito ospitato nel cloud che funge da hub messaggi centrale per la comunicazione tra un'applicazione IoT e i relativi dispositivi collegati. È possibile connettere milioni di dispositivi e le relative soluzioni back-end in modo affidabile e sicuro. Quasi tutti i dispositivi possono essere connessi a un hub IoT.

Dettagli dello scenario

Questo scenario illustra come ottenere informazioni dettagliate dai dati di streaming live. È possibile acquisire dati in modo continuo da qualsiasi dispositivo IoT o log dai clickstream del sito Web ed elaborarli quasi in tempo reale.

Potenziali casi d'uso

Questa soluzione è ideale per il settore multimediale e di intrattenimento. Lo scenario riguarda la creazione di analisi dai dati di streaming live.

Considerazioni

Queste considerazioni implementano i pilastri di Azure Well-Architected Framework, che è un set di set di principi guida che possono essere usati per migliorare la qualità di un carico di lavoro. Per altre informazioni, vedere Framework ben progettato di Microsoft Azure.

Ottimizzazione dei costi

L'ottimizzazione dei costi riguarda l'analisi dei modi per ridurre le spese non necessarie e migliorare l'efficienza operativa. Per altre informazioni, vedere Panoramica del pilastro di ottimizzazione dei costi.

È possibile usare il calcolatore prezzi di Azure per ottenere una stima dei prezzi personalizzata.

Passaggi successivi