Wykrywanie anomalii w strumieniach danych czasu rzeczywistego

Dzięki rozwiązaniu Cortana Intelligence IT Anomaly Insights działy IT mogą w szybki, automatyczny i skalowalny sposób wykrywać i usuwać problemy na podstawie podstawowych metryk kondycji z infrastruktury (procesor CPU, pamięć itp.) i usług (przekroczenia limitu czasu oczekiwania, różnice w umowie SLA, spadki napięcia) oraz innych kluczowych wskaźników wydajności (zaległości w zamówieniach, niepowodzenia logowania i płatności itp.). Rozwiązanie to zawiera także funkcję „Wypróbuj teraz”, która umożliwia eksperymentowanie z własnymi danymi w celu poznania dostępnych korzyści. Funkcja wdrażania pozwala natomiast na szybkie rozpoczęcie korzystania z rozwiązania na platformie Azure przez wdrożenie kompleksowych składników w ramach subskrypcji i pełną kontrolę w zakresie dostosowywania do potrzeb firmy.

Opis

Uwaga: Jeśli masz już wdrożone to rozwiązanie, kliknij tutaj, aby wyświetlić to wdrożenie.

Skontaktuj się z jednym z naszych partnerów w zakresie analizy zaawansowanej w celu przeprowadzenia weryfikacji koncepcji w Twoim środowisku: Neal Analytics, Empired

Szacowany czas aprowizacji: 30 minut

Używane współcześnie usługi generują duże ilości danych telemetrycznych służących do śledzenia różnych aspektów kondycji operacyjnej, wydajności systemu, szczegółowych danych o użyciu, alertów i wielu innych elementów. Często jednak monitorowanie i zbieranie szczegółowych informacji przez działy IT z tak dużych zbiorów danych nie jest w pełni zautomatyzowane i może prowadzić do występowania błędów (zwykle używane są reguły i alerty wyzwalane po osiągnięciu wartości progowej), co utrudnia skuteczne i precyzyjne określenie kondycji systemu w danym momencie.

Rozwiązanie Cortana Intelligence IT Anomaly Insights pomaga klientom poradzić sobie z tym problemem, udostępniając proste w obsłudze środowisko oparte na pakiecie Cortana Intelligence Solutions (w celu łatwego wdrażania usług platformy Azure) oraz na interfejsie API wykrywania anomalii w ramach usługi Azure Machine Learning (w celu w pełni automatycznego śledzenia danych historycznych i czasu rzeczywistego). Ułatwia to decydentom w firmach szybkie oszacowanie wartości rozwiązania (z uwzględnieniem własnych danych klientów) oraz dostosowywanie i rozszerzanie jego możliwości pod kątem konkretnych scenariuszy dzięki sprawnie działającym funkcjom weryfikacji koncepcji. Rozwiązanie to zapewnia organizacjom następujące możliwości:

  • Wykorzystanie zaawansowanego interfejsu API wykrywania anomalii w ramach usługi Azure Machine Learning w celu poznawania anomalii i reagowania na nie na podstawie danych historycznych i czasu rzeczywistego. Pozwala to wyeliminować czynnik ludzki, który zwykle jest konieczny do modyfikacji progów pod kątem wykrywania przeoczonych anomalii i minimalizacji fałszywych alarmów.
  • Szybkie poznanie potencjału rozwiązania dzięki eksperymentom z własnymi danymi bez konieczności ponoszenia inwestycji z wyprzedzeniem. Ponadto funkcja „Wypróbuj teraz” pozwala użytkownikom wybrać właściwy zestaw parametrów czułości dla danego przypadku użycia.
  • Szybkie wdrożenie kompleksowego potoku danych w ramach subskrypcji w celu pozyskiwania danych ze źródeł lokalnych i w chmurze, a następnie zgłaszania zdarzeń o cechach anomalii do systemów monitorowania i przypisywania biletów bez dodatkowej konfiguracji.

Funkcja „Wypróbuj teraz” korzystająca z usługi Power BI

Wstępnie skonfigurowany pulpit nawigacyjny rozwiązania IT Anomaly Insights

Diagram rozwiązania

Architekturę rozwiązania wraz ze szczegółowymi instrukcjami znajdziesz w witrynie GitHub.

Zgodnie z opisem na poniższym diagramie rozwiązania strumienie metryk czasu rzeczywistego pochodzące z systemów lokalnych i chmurowych mogą być kierowane do kolejki w centrum zdarzeń usługi Azure Event Hubs. Zdarzenia te (czyli punkty danych szeregów czasowych) są przetwarzane przez usługę Azure Stream Analytics, gdzie są agregowane w 5-minutowych interwałach. Każdy szereg czasowy jest wysyłany do interfejsu API wykrywania anomalii na platformie Azure w celu jego oszacowania w 15-minutowych odstępach. Wyniki uzyskane z interfejsu API wraz z wymiarami podanymi podczas wprowadzania danych są następnie zapisywane w usłudze Azure SQL DB. Wykryte anomalie są ponadto publikowane w usłudze Azure Service Bus, aby można było je wykorzystać w systemach biletów na dalszych etapach procesu. Rozwiązanie udostępnia też instrukcje konfiguracji pulpitu nawigacyjnego usługi Power BI, aby ułatwić szybką wizualizację anomalii i analizę głównych przyczyn ich występowania.

Interfejs API wykrywania anomalii

Zarówno w funkcji „Wypróbuj teraz”, jak i we wdrożonym rozwiązaniu używany jest interfejs API wykrywania anomalii. Umożliwia on wykrywanie różnych rodzajów wzorców anomalii w danych szeregów czasowych. Jego działanie polega na przypisywaniu tzw. wyniku anomalii do każdego punktu danych w szeregu czasowym. Wyniki te można następnie wykorzystać do generowania alertów, monitorowania na pulpitach nawigacyjnych i nawiązywania łączności z systemami biletów. Interfejs API wykrywania anomalii jest w stanie wykryć następujące rodzaje anomalii w danych szeregów czasowych:

  • Gwałtowne wzrosty i spadki: na przykład podczas monitorowania liczby nieudanych prób zalogowania do usługi lub przejść do kasy w sklepie internetowym wykrycie nietypowego wzrostu lub spadku aktywności może oznaczać atak lub problem z usługą.
  • Trendy pozytywne i negatywne: na przykład podczas monitorowania użycia pamięci w środowisku obliczeniowym zmniejszanie się rozmiaru pamięci wskazuje potencjalny przeciek pamięci, a podczas monitorowania długości kolejki w usłudze stały trend wzrostowy może oznaczać problem z oprogramowaniem.
  • Zmiany poziomów i zmiany w dynamicznym zakresie wartości: na przykład korzystne może okazać się monitorowanie zmian poziomów opóźnienia działania usługi po jej uaktualnieniu lub niższego poziomu wyjątków po uaktualnieniu.

Zrzeczenie odpowiedzialności

© 2017 Microsoft Corporation. Wszelkie prawa zastrzeżone. Te informacje są udostępniane w stanie „jak są” i mogą ulec zmianie bez powiadomienia. Firma Microsoft nie udziela żadnych gwarancji, jawnych ani dorozumianych, w związku z informacjami przedstawionymi tutaj. Do wygenerowania rozwiązania wykorzystano dane innej firmy. Na Tobie spoczywa odpowiedzialność za przestrzeganie praw innych, w tym za uzyskanie odpowiednich licencji i postępowanie zgodnie z nimi przy tworzeniu podobnych zbiorów danych.

Powiązane architektury rozwiązań

Konserwacja zapobiegawcza

To rozwiązanie do konserwacji predykcyjnej monitoruje samolot i przewiduje pozostały okres eksploatacji części silnika.

Zapewnianie jakości

Dzięki systemom kontroli jakości firmy mogą zapobiegać występowaniu usterek w procesach dostarczania towarów i usług klientom. Zbudowanie takiego systemu, który zbiera dane i znajduje potencjalne problemy na wszystkich etapach procesu, może zapewnić ogromne korzyści. Na przykład w produkcji cyfrowej kontrola jakości na całej linii montażowej ma kluczowe znaczenie. Możliwość wykrywania zastojów i potencjalnych usterek przed ich wystąpieniem może znacznie obniżyć koszty związane ze stratami i poprawkami, a przy okazji poprawić wydajność.