Analiza multimediów

Usługi obsługujące mowę i wizję działające na skalę przedsiębiorstwa oraz oferujące bezpieczeństwo, zgodność i globalny zasięg

Azure Media Analytics to kolekcja składników obsługujących mowę i informacje wizualne, których organizacje i przedsiębiorstwa mogą używać do przeprowadzania analiz plików wideo prowadzących do podjęcia działań za pomocą zaawansowanej technologii uczenia maszynowego. Usługi Media Analytics są hostowane na platformie usługi Azure Media Services, rozwiązania multimedialnego na platformie Azure, które służy do kodowania, szyfrowania i przesyłania strumieniowego materiałów audio i wideo w odpowiedniej skali, na żywo lub na żądanie (VOD). Usługa Media Analytics jest oferowana na skalę przedsiębiorstwa, zapewniając zgodność, bezpieczeństwo i globalny zasięg, których potrzebują duże organizacje.

Jakie branże mogą korzystać z usługi Media Analytics?

Bezpieczeństwo publiczne

 • Analizowanie dowodów. Zbieranie multimediów z kamer osobistych i instalowanych w pojazdach oraz innych urządzeń, a następnie analizowanie ich w celu wyodrębnienia danych analitycznych z zachowaniem wymagań łańcucha dowodowego.
 • Ochrona tożsamości. Modyfikowanie wideo w celu ochrony tożsamości osób i zachowania zgodności z ustawą Freedom of Information Act.
 • Przyspieszanie śledztwa. Wyodrębnianie danych z multimediów i budowanie na ich podstawie inteligentnych indeksów wyszukiwania, które mogą przyspieszyć śledztwo.

Monitorowanie

 • Śledztwa dotyczące przestępstw. Przetwarzanie wideo i zdarzeń zebranych z kamer monitorujących w skali.
 • Zmniejszanie liczby wyników fałszywie dodatnich. Przeprowadzanie głębokich analiz fragmentów wideo skojarzonych ze zdarzeniami ruchu i pochodzących z kamer monitorujących w celu zmniejszenia liczby wyników fałszywie dodatnich.
 • Podsumowanie nagrań z monitorowania. Generowanie inteligentnego podsumowania nagrań z monitorowania za pomocą funkcji przyspieszonych ujęć poklatkowych, która umożliwia uzyskanie płynnych wideo poklatkowych.

Handel detaliczny

 • Analizowanie telefonów od klientów. Usługa Media Indexer umożliwia konwertowanie mowy na tekst w przypadku danych audio pochodzących z rozmów działu obsługi klienta oraz wyszukiwanie w nim wzorców.
 • Analizowanie wzorców dotyczących klientów. Korelowanie trasy poruszania się klienta po sklepie z danymi sprzedaży na potrzeby podejmowania decyzji o rozmieszczeniu produktów.

Inne branże

 • Zamiana mowy na tekst. Ważne w przypadku każdej firmy, która zapewnia obsługę klientów przez telefoniczne biuro obsługi. Z tekstu wyodrębnionego z rozmów prowadzonych w ramach obsługi klientów można utworzyć indeks na potrzeby wyszukiwania, a także na jego podstawie analizować ton wypowiedzi klienta i specjalisty ds. klienta.
 • Optyczne rozpoznawanie znaków (OCR). Przydatne dla wszystkich firm, które posługują się wideo z widocznym na nich tekstem, takimi jak wideo z prezentacjami z programu PowerPoint lub wideo, na których zarejestrowano osoby z identyfikatorami.
 • Rozpoznawanie emocji na twarzach. Przydatne dla wszystkich firm, które mają wideo z widocznymi na nich klientami. Wyrazy twarzy można skorelować z wyodrębnionym tekstem za pomocą Indeksatora w celu podjęcia decyzji dotyczących przyszłych interakcji z klientem.

Dostępne składniki

Indeksator

 • Automatyczne generowanie standardowych plików napisów dla wideo
 • Możliwość wyboru z rosnącej listy języków
 • Wyodrębnianie wypowiedzianych słów kluczowych pomagające w wyszukiwaniu i określaniu rekomendacji
 • Funkcja adaptacji do niestandardowego słownika umożliwia rozpoznawanie mowy właściwej dla konkretnej domeny

Dowiedz się więcej

Przyspieszone ujęcia poklatkowe (wersja zapoznawcza)

 • Technologia stworzona na podstawie ponad 20 lat badań nad cyfrowym przetwarzaniem zdjęć
 • Tworzenie płynnych i stabilizowanych wideo poklatkowych na podstawie wideo kręconych z perspektywy pierwszej osoby
 • Obsługa różnych współczynników przyspieszenia odtwarzania — od 1x do 25x

Dowiedz się więcej

Wykrywanie ruchu (wersja zapoznawcza)

 • Wykrywanie wystąpienia ruchu w wideo przy stacjonarnych tłach
 • Eliminowanie wyników fałszywie dodatnich spowodowanych zmianami oświetlenia, cieniami, małymi owadami i innymi czynnikami

Dowiedz się więcej

Wykrywanie twarzy (wersja zapoznawcza)

 • Wykrywanie twarzy występujących w wideo
 • Śledzenie ruchu twarzy na wielu klatkach
 • Analizowanie metadanych danych wyjściowych, które zawierają informacje o znacznikach czasu i lokalizacjach twarzy

Dowiedz się więcej

Wykrywanie emocji na twarzy (wersja zapoznawcza)

 • Rozpoznawanie emocji osoby lub zgromadzenia z upływem czasu na podstawie wyrazów twarzy na wideo
 • Identyfikowanie emocji na podstawie wyrazów twarzy, które badania psychologiczne określiły jako uniwersalne
 • Rozpoznawanie konkretnych emocji, takich jak szczęście, smutek, zaskoczenie, gniew, pogarda, strach, zamyślenie, a także brak wyraźnych emocji

Dowiedz się więcej

Podsumowanie wideo (wersja zapoznawcza)

 • Tworzenie podsumowań długich wideo, aby umożliwić klientom ich szybkie przejrzenie
 • Wybór krótkich podglądów o długości kilku sekund lub nieco dłuższych, trwających kilka minut
 • Wybór przejść przenikania do zastosowania między ujęciami w wideo z podsumowaniem
 • Doskonałe do tworzenia stron sieci Web podobnych do strony wyszukiwania Wideo Bing

Dowiedz się więcej

Optyczne rozpoznawanie znaków w wideo (wersja zapoznawcza)

 • Wyodrębnianie drukowanych wyrazów z zawartości wideo
 • Wybieranie własnej częstotliwości próbkowania w celu wyważenia wydajności i jakości
 • Określanie miejsca na wideo, w którym mają być szukane napisy.

Dowiedz się więcej

Moderowanie zawartości (wersja zapoznawcza)

 • Wykrywanie pornografii, rasizmu, wulgaryzmów, przemocy i innej zawartości, która może podlegać filtrowaniu w materiałach wideo
 • Zmniejszenie kosztów i liczby błędów przez uniknięcie konieczności zatrudnienia moderatorów do przeglądania zawartości pod kątem obraźliwych, nielegalnych i nieodpowiednich treści

Dowiedz się więcej

Utwórz rozwiązanie multimedialne jeszcze dzisiaj