Process för avvikelseidentifiering

Azure Databricks
Azure Service Bus
Azure Storage Accounts

Den här artikeln beskriver en arkitektur för en implementering i nära realtid av en avvikelseidentifieringsprocess.

Arkitektur

Diagram över processarkitekturen för avvikelseidentifiering.

Ladda ned en Visio-fil med den här arkitekturen.

Dataflöde

  1. Tidsseriedata kan komma från flera källor, till exempel Azure Database for MySQL, Blob Storage, Event Hubs, Azure Cosmos DB, SQL Database och Azure Database for PostgreSQL.
  2. Data matas in i beräkning från olika lagringskällor som ska övervakas av Avvikelseidentifiering.
  3. Databricks hjälper till att aggregera, sampla och beräkna rådata för att generera tiden med de identifierade resultaten. Databricks kan bearbeta dataström och statiska data. Stream Analytics och Azure Synapse kan vara alternativ baserat på kraven.
  4. API:et för avvikelseidentifiering identifierar avvikelser och returnerar resultatet för beräkning.
  5. Avvikelserelaterade metadata placeras i kö.
  6. Application Insights väljer meddelandet från meddelandekön baserat på de avvikelserelaterade metadata och skickar en avisering om avvikelsen.
  7. Resultaten lagras i Azure Data Lake Service Gen2.
  8. Webbprogram och Power BI kan visualisera resultatet av avvikelseidentifieringen.

Komponenter

Viktiga tekniker som används för att implementera den här arkitekturen:

  • Service Bus: Tillförlitlig molnmeddelanden som en tjänst (MaaS) och enkel hybridintegrering.
  • Azure Databricks: Snabb, enkel och samarbetsbaserad Apache Spark-baserad analystjänst.
  • Power BI: Bi-verktyg för interaktiv datavisualisering.
  • Lagringskonton: Beständig, högtillgänglig och massivt skalbar molnlagring.
  • Cognitive Services: Molnbaserade tjänster med REST API:er och klientbiblioteks-SDK:er som hjälper dig att bygga in kognitiv intelligens i dina program.
  • Logic Apps: Serverlös plattform för att skapa företagsarbetsflöden som integrerar program, data och tjänster. I den här arkitekturen utlöses logikapparna av HTTP-begäranden.
  • Azure Data Lake Storage Gen2: Azure Data Lake Storage Gen2 tillhandahåller filsystemssemantik, säkerhet på filnivå och skalning.
  • Application Insights: Application Insights är en funktion i Azure Monitor som tillhandahåller utökningsbar programprestandahantering (APM) och övervakning för livewebbappar.

Alternativ

  • Event Hubs med Kafka: Ett alternativ till att köra ditt eget Kafka-kluster. Den här Event Hubs-funktionen tillhandahåller en slutpunkt som är kompatibel med Kafka-API:er.
  • Azure Synapse Analytics: En analystjänst som samlar företagsdatalager och stordataanalys.
  • Azure Machine Learning: Skapa, träna, distribuera och hantera anpassade modeller för maskininlärning/avvikelseidentifiering i en molnbaserad miljö.

Information om scenario

Med Azure Cognitive Services Avvikelseidentifiering-API:et kan du övervaka och identifiera avvikelser i dina tidsseriedata utan att behöva känna till maskininlärning. API:ernas algoritmer anpassas genom att automatiskt identifiera och tillämpa de bäst passande modellerna på dina tidsseriedata, oavsett bransch, scenario eller datavolym. De fastställer gränser för avvikelseidentifiering, förväntade värden och avvikande datapunkter.

Potentiella användningsfall

Vissa områden som avvikelseidentifiering hjälper till att övervaka:

  • Bankbedrägerier (finansbranschen)
  • Strukturella defekter (tillverkningsindustrin)
  • Medicinska problem (sjukvårdsbranschen)

Att tänka på

Dessa överväganden implementerar grundpelarna i Azure Well-Architected Framework, som är en uppsättning vägledande grundsatser som kan användas för att förbättra kvaliteten på en arbetsbelastning. Mer information finns i Microsoft Azure Well-Architected Framework.

Skalbarhet

De flesta komponenter som används i det här exempelscenariot är hanterade tjänster som skalas automatiskt.

Allmän vägledning om hur du utformar skalbara lösningar finns i checklistan för prestandaeffektivitet i Azure Architecture Center.

Säkerhet

Säkerhet ger garantier mot avsiktliga attacker och missbruk av dina värdefulla data och system. Mer information finns i Översikt över säkerhetspelare.

Hanterade identiteter för Azure-resurser används för att ge åtkomst till andra resurser som är interna för ditt konto och sedan tilldelas till dina Azure Functions. Tillåt dessa identiteter att endast komma åt nödvändiga resurser för att säkerställa att inget extra exponeras för dina funktioner (och potentiellt för dina kunder).

Allmän vägledning om hur du utformar säkra lösningar finns i Azure Security-dokumentationen.

Motståndskraft

Alla komponenter i det här scenariot hanteras, så på regional nivå är de alla motståndskraftiga automatiskt.

Allmän vägledning om hur du utformar motståndskraftiga lösningar finns i Designa elastiska program för Azure.

Kostnadsoptimering

Kostnadsoptimering handlar om att titta på sätt att minska onödiga utgifter och förbättra drifteffektiviteten. Mer information finns i Översikt över kostnadsoptimeringspelare.

Information om kostnaden för att köra det här scenariot finns i den förfyllda kalkylatorn med alla tjänster. Om du vill se hur prissättningen skulle ändras för ditt specifika användningsfall ändrar du lämpliga variabler så att de matchar din förväntade trafik/dina datavolymer.

Vi har angett tre exempel på kostnadsprofiler baserat på mängden trafik (vi antar att alla bilder är 100 kb stora):

  • Exempelkalkylator: det här prisexemplet är en kalkylator med alla tjänster i den här arkitekturen, förutom Power BI och en anpassad aviseringslösning.

Deltagare

Den här artikeln underhålls av Microsoft. Det har ursprungligen skrivits av följande medarbetare.

Huvudförfattare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.

Nästa steg