Pomiń nawigację

Rozpoznawanie osoby mówiącej

Rozpoznawaj osoby mówiące lub używaj mowy jako metody uwierzytelniania za pomocą rozpoznawania osoby mówiącej

Weryfikacja osoby mówiącej

Weryfikuj za pomocą głosu. Interfejsu API możesz użyć w celu dodania do aplikacji inteligentnego narzędzia weryfikującego. Tożsamość danej osoby mówiącej możesz zweryfikować za pomocą jej głosu.

Aby sprawdzić, jak to działa, wybierz frazę hasła z podanej listy fraz. Użyj tej frazy i nagraj trzy próbki audio, aby zarejestrować swój głos w usłudze — ten krok jest nazywany „rejestracją”. Po zakończeniu rejestracji możesz rozpocząć krok weryfikacji, używając różnych nagrań głosu lub frazy, aby przetestować usługę.

Zobacz, jak to działa

"i am going to make him an offer he cannot refuse"

Przeczytaj powyższą frazę trzy razy, aby zarejestrować swój głos.

1
2
3

Chcesz to skompilować?

Identyfikacja osoby mówiącej

Rozpoznawaj osoby zabierające głos. Za pomocą interfejsu API możesz określić tożsamość nieznanej osoby mówiącej. Dane wejściowe w postaci głosu nieznanej osoby mówiącej są porównywane z głosami grupy wybranych osób. W przypadku znalezienia dopasowania zostanie zwrócona tożsamość osoby mówiącej.

Wybraliśmy 5 różnych prezydentów Stanów Zjednoczonych i zarejestrowaliśmy ich w usłudze, korzystając z jednego z ich przemówień. Aby zobaczyć, jak działa wersja demonstracyjna, wybierz przemówienie jednego z prezydentów, klikając poniższe próbki audio, lub przekaż swoją, aby przetestować sposób automatycznego określania mówiącego prezydenta.

Zobacz, jak to działa

Prezydent Barack Obama
Prezydent George W Bush
Prezydent William J Clinton
Prezydent George H W Bush
Prezydent Ronald Reagan
Prezydent Jimmy Carter

Chcesz to skompilować?

Poznaj interfejsy API usług Cognitive Services

Przetwarzanie obrazów

Wyodrębnianie określonych informacji z obrazów

Rozpoznawanie twarzy

Wykrywanie, identyfikowanie, analizowanie, organizowanie i znakowanie twarzy na zdjęciach

Indeksator wideo WERSJA ZAPOZNAWCZA

Udostępnienie analiz wideo

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i filmów wideo

Niestandardowe przetwarzanie obrazów WERSJA ZAPOZNAWCZA

Łatwo dostosowuj najwyższej klasy własne modele przetwarzania obrazów dla unikatowych przypadków użycia

Analiza tekstu

Łatwe ocenianie opinii i tematów w celu zrozumienia potrzeb użytkowników

Tłumaczenie tekstu w usłudze Translator

Łatwe wykonywanie tłumaczenia maszynowego dzięki prostemu wywołaniu interfejsu API REST

Sprawdzanie pisowni Bing

Wykrywaj i poprawiaj błędy pisowni w aplikacji

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i filmów wideo

Language Understanding

Naucz aplikacje rozpoznawać polecenia użytkowników

Rozpoznawanie mowy Bing

Konwertowanie mowy na tekst i tekstu na mowę w celu zrozumienia intencji użytkownika

Rozpoznawanie osoby mówiącej WERSJA ZAPOZNAWCZA

Identyfikuj i weryfikuj osoby mówiące na podstawie głosu

Tłumaczenie mowy w usłudze Translator

Łatwe tłumaczenie mowy w czasie rzeczywistym dzięki prostemu wywołaniu interfejsu API REST

Mowa niestandardowa WERSJA ZAPOZNAWCZA

Pokonaj bariery rozpoznawania mowy, takie jak styl wypowiedzi, hałas w tle czy słownictwo

Usługi mowy WERSJA ZAPOZNAWCZA

Ujednolicone usługi przetwarzania mowy umożliwiające zamianę mowy na tekst i tekstu na mowę oraz tłumaczenie mowy

QnA Maker

Wydobądź z informacji konwersacyjne odpowiedzi, po których łatwo się poruszać

Chcesz zrewolucjonizować swoją aplikację?