Rozpoznawanie osoby mówiącej

Rozpoznawaj osoby mówiące lub używaj mowy jako metody weryfikacji za pomocą technologii rozpoznawania osoby mówiącej

Weryfikacja osoby mówiącej

Weryfikuj za pomocą głosu. Interfejsu API możesz użyć w celu dodania do aplikacji inteligentnego narzędzia weryfikującego. Tożsamość danej osoby mówiącej możesz zweryfikować za pomocą jej głosu.

Aby sprawdzić, jak to działa, wybierz frazę hasła z podanej listy fraz. Użyj tej frazy i nagraj trzy próbki audio, aby zarejestrować swój głos w usłudze — ten krok jest nazywany „rejestracją”. Po zakończeniu rejestracji możesz rozpocząć krok weryfikacji, używając różnych nagrań głosu lub frazy, aby przetestować usługę.

Zobacz, jak to działa

"i am going to make him an offer he cannot refuse"

Przeczytaj powyższą frazę trzy razy, aby zarejestrować swój głos.

1
2
3

Chcesz to skompilować?

Identyfikacja osoby mówiącej

Rozpoznawaj osoby zabierające głos. Za pomocą interfejsu API możesz określić tożsamość nieznanej osoby mówiącej. Dane wejściowe w postaci głosu nieznanej osoby mówiącej są porównywane z głosami grupy wybranych osób. W przypadku znalezienia dopasowania zostanie zwrócona tożsamość osoby mówiącej.

Wybraliśmy 5 różnych prezydentów Stanów Zjednoczonych i zarejestrowaliśmy ich w usłudze, korzystając z jednego z ich przemówień. Aby zobaczyć, jak działa wersja demonstracyjna, wybierz przemówienie jednego z prezydentów, klikając poniższe próbki audio, lub przekaż swoją, aby przetestować sposób automatycznego określania mówiącego prezydenta.

Zobacz, jak to działa

Prezydent Barack Obama
Prezydent George W Bush
Prezydent William J Clinton
Prezydent George H W Bush
Prezydent Ronald Reagan
Prezydent Jimmy Carter

Chcesz to skompilować?

Poznaj interfejsy API usług Cognitive Services

Przetwarzanie obrazów

Wyodrębnianie określonych informacji z obrazów

Rozpoznawanie twarzy

Wykrywanie, identyfikowanie, analizowanie, organizowanie i znakowanie twarzy na zdjęciach

Rozpoznawanie pisma odręcznego

Oparta na sztucznej inteligencji usługa umożliwiająca rozpoznawanie zawartości w postaci pisma cyfrowego, na przykład pisma ręcznego, kształtów i układu pisanych odręcznie dokumentów

Indeksator wideo

Udostępnienie analiz wideo

Niestandardowe przetwarzanie obrazów

Łatwo dostosowuj najwyższej klasy własne modele przetwarzania obrazów dla unikatowych przypadków użycia

Rozpoznawanie formularzy

Napędzana przez sztuczną inteligencję usługa wyodrębniania dokumentów, która rozpoznaje formularze

Analiza tekstu

Łatwe ocenianie opinii i tematów w celu zrozumienia potrzeb użytkowników

Tłumaczenie tekstu w usłudze Translator

Łatwe wykonywanie tłumaczenia maszynowego dzięki prostemu wywołaniu interfejsu API REST

QnA Maker

Wydobądź z informacji konwersacyjne odpowiedzi, po których łatwo się poruszać

Language Understanding

Naucz aplikacje rozpoznawać polecenia użytkowników

Czytnik immersyjny

Zwiększ możliwości użytkowników w każdym wieku i z różnymi zdolnościami w zakresie czytania i rozumienia tekstu

Usługi mowy

Ujednolicone usługi przetwarzania mowy umożliwiające zamianę mowy na tekst i tekstu na mowę oraz tłumaczenie mowy

Rozpoznawanie osoby mówiącej

Identyfikuj i weryfikuj osoby mówiące na podstawie głosu

Tłumaczenie mowy

Łatwe integrowanie tłumaczenia mowy w czasie rzeczywistym z aplikacją

Zamiana mowy na tekst

Konwertuj dźwięk na tekst, aby umożliwić bardziej naturalne interakcje

Zamiana tekstu na mowę

Konwertuj tekst na mowę w celu tworzenia bardziej naturalnych i lepiej dostępnych interfejsów

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i wideo

Narzędzie do wykrywania anomalii

Łatwo dodawaj funkcje wykrywania anomalii do aplikacji.

Personalizacja

Usługa sztucznej inteligencji udostępniająca spersonalizowane środowisko użytkownika

Chcesz zrewolucjonizować swoją aplikację?