Pomiń nawigację

Rozpoznawanie mowy Bing

Konwertowanie dźwięku na tekst, rozumienie intencji i konwertowanie z powrotem na mowę na potrzeby naturalnego reagowania

Rozpoznawanie mowy

Przekonwertuj mowę na tekst. Temu interfejsowi API można wydać polecenie włączenia się i rozpoznawania dźwięku z mikrofonu w czasie rzeczywistym, rozpoznawania dźwięku w czasie rzeczywistym pochodzącego z innego źródła audio lub rozpoznawania dźwięku z pliku. W każdym z przypadków jest dostępna opcja przesyłania strumieniowego w czasie rzeczywistym, dzięki której podczas przesyłania dźwięku na serwer zwracane są również częściowe wyniki rozpoznawania.

Interfejs API zamieniania mowy na tekst umożliwia tworzenie inteligentnych aplikacji wywoływanych głosem. Aby sprawdzić, jak to działa, wybierz swój język docelowy, a następnie kliknij mikrofon i zacznij mówić. Możesz też po prostu kliknąć jedno z przykładowych wyrażeń mowy, aby zobaczyć, jak działa rozpoznawanie mowy. Używając tej wersji demonstracyjnej, wyrażasz zgodę na udostępnienie swoich głosowych danych wejściowych firmie Microsoft na potrzeby udoskonalenia usługi

Zobacz, jak to działa

Aby wypróbować wersję demonstracyjną za pomocą Twojego własnego głosu przy użyciu mikrofonu, zmień przeglądarkę na inną, obsługującą protokół WebRTC, na przykład najnowszą wersję przeglądarki Microsoft Edge, Firefox lub Chrome.

Chcesz to skompilować?

Zamiana tekstu na mowę

Konwertuj tekst na dźwięk mówiony. Jeśli aplikacje muszą „odpowiedzieć” swoim użytkownikom, można użyć tego interfejsu API do konwertowania tekstu generowanego przez aplikację na dźwięk, który może zostać odtworzony użytkownikowi.

Interfejs API zamieniania tekstu na mowę umożliwia tworzenie inteligentnych aplikacji, które potrafią mówić. Możesz go teraz przetestować — po prostu wybierz swój język docelowy, dodaj swoje zdania i kliknij przycisk odtwarzania, aby zobaczyć, jak działa synteza mowy. Używając tej wersji demonstracyjnej, wyrażasz zgodę na udostępnienie swoich głosowych danych wejściowych firmie Microsoft na potrzeby udoskonalenia usługi.

Zobacz, jak to działa

Pozostała liczba znaków: 500

Chcesz to skompilować?

Poznaj interfejsy API usług Cognitive Services

Przetwarzanie obrazów

Wyodrębnianie określonych informacji z obrazów

Rozpoznawanie twarzy

Wykrywanie, identyfikowanie, analizowanie, organizowanie i znakowanie twarzy na zdjęciach

Indeksator wideo WERSJA ZAPOZNAWCZA

Udostępnienie analiz wideo

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i filmów wideo

Niestandardowe przetwarzanie obrazów WERSJA ZAPOZNAWCZA

Łatwo dostosowuj najwyższej klasy własne modele przetwarzania obrazów dla unikatowych przypadków użycia

Analiza tekstu

Łatwe ocenianie opinii i tematów w celu zrozumienia potrzeb użytkowników

Tłumaczenie tekstu w usłudze Translator

Łatwe wykonywanie tłumaczenia maszynowego dzięki prostemu wywołaniu interfejsu API REST

Sprawdzanie pisowni Bing

Wykrywaj i poprawiaj błędy pisowni w aplikacji

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i filmów wideo

Language Understanding

Naucz aplikacje rozpoznawać polecenia użytkowników

Rozpoznawanie mowy Bing

Konwertowanie mowy na tekst i tekstu na mowę w celu zrozumienia intencji użytkownika

Rozpoznawanie osoby mówiącej WERSJA ZAPOZNAWCZA

Identyfikuj i weryfikuj osoby mówiące na podstawie głosu

Tłumaczenie mowy w usłudze Translator

Łatwe tłumaczenie mowy w czasie rzeczywistym dzięki prostemu wywołaniu interfejsu API REST

Mowa niestandardowa WERSJA ZAPOZNAWCZA

Pokonaj bariery rozpoznawania mowy, takie jak styl wypowiedzi, hałas w tle czy słownictwo

Usługi mowy WERSJA ZAPOZNAWCZA

Ujednolicone usługi przetwarzania mowy umożliwiające zamianę mowy na tekst i tekstu na mowę oraz tłumaczenie mowy

QnA Maker

Wydobądź z informacji konwersacyjne odpowiedzi, po których łatwo się poruszać

Chcesz zrewolucjonizować swoją aplikację?